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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 鸡 断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 以 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup， 
Brain W. Kernighan, Dennis Ritchie，Jim Gray，Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 学 习 、 研 究 
及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010 ) 88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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大 多 数 计算 机 专业 的 学 生 并 不 太 喜 欢 也 不 太 愿 意 学 习 汇 编 语言 ， 因 为 它 和 机 器 硬件 结合 
得 非常 紧密 ,使 用 起 来 不 怎么 得 心 应 手 ， 在 解决 问题 方面 ,好像 也 不 如 其 他 高 级 语言 有 用 。 
在 教学 过 程 中 ， 不 止 一 次 听 到 学 生 抱 怨 说 :“ 现 在 都 不 用 汇编 语言 了 ， 为 什么 还 要 学 它 ?” 彼 
时 ， 受 限于 时 间 和 授课 内 容 ， 总 觉得 不 能 完全 讲 清楚 这 种 语言 的 有 用 性 和 重要 性 。 因 此 ， 当 
看 到 这 本 书后 ， 我 们 就 想 要 将 它 介绍 给 大 家 。 

本 书 译 自 《 Assembly Language for x86 Processors 》 第 7 版 ， 内 容 包 括 : 基本 概念 ，x86 
处 理 器 架构 ， 汇 编 语 言 基础 ， 数 据 传 输 、 寻 址 和 算术 运算 ， 过 程 ， 条 件 处 理 ， 整 数 运 算 ， 高 
级 过 程 ， 字 符 串 和 数组 ， 结 构 和 宏 ，MS-Windows 编程 ， 浮 点 数 处 理 和 指令 编码 ， 高 级 语言 
接口 等 。 本 书 还 包括 64 位 CPU 架构 和 编程 的 内 容 ， 以 及 64 位 的 子 程序 库 Irvine64。 

如 果 读 者 想 了 解 BIOS 编程 、MS-DOS 服务 等 内 容 ， 可 以 登录 英文 书 配套 网 站 进行 阅读 。 
同时 ， 网 站 上 还 提供 了 VideoNotes 教学 视频 直观 演示 汇编 语言 的 基本 概念 。 

本 书 具 有 丰富 的 习题 ， 并 按照 不 同 要 求 与 难度 分 为 简 答题 、 算 法 基础 练习 以 及 编程 练 
习 。 因 此 ， 做 习题 的 过 程 就 是 一 个 循序 渐进 、 学 以 致 用 的 过 程 。 相 信 完 成 这 些 习 题 后 ， 大 家 
就 不 再 会 觉得 汇编 语言 有 多 么 遥远 了 。 

在 此 感谢 机 械 工业 出 版 社 华章 公司 的 朱 动 编辑 ， 感 谢 她 向 我 们 推荐 了 这 本 书 ， 以 及 在 翻 
译 过 程 中 给 予 我 们 的 支持 和 帮助 。 

虽然 在 翻译 过 程 中 我 们 尽量 做 到 认真 细致 ， 对 每 一 个 有 疑问 的 点 都 进行 了 讨论 ,但 是 由 
于 能 力 所 限 ， 还 是 会 存在 错误 与 疏漏 ， 希 望 广大 读者 批评 指正 ， 同 时 我 们 也 会 将 勘误 更 新 到 
网 站 。 


贺 莲 ” 菊 奕 利 
2015 年 9 月 于 玫 珈 山 
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本 书 介绍 x86 和 Inte164 处 理 器 的 汇编 语言 编程 与 架构 ， 适 合作 为 下 述 几 类 大 学 课程 的 
教材 : 

。 汇编 语言 编程 

e 计算 机 系统 基础 

e 计算 机 体系 结构 基础 

学 生 使 用 Intel 或 AMD 处 理 器 ， 用 Microsoft 宏 汇 编 器 ( Microsoft Macro Assembler， 
MASM) 编程 ， MASM 运行 在 Microsoft Windows 最 新 的 版 本 上 。 尽 管 本 书 的 初衷 是 作为 大 
学 生 的 编程 教材 ， 但 它 也 是 计算 机 体系 结构 课程 的 有 效 补充 。 本 书 广 受 欢迎 ， 前 几 个 版 本 已 
被 翻译 为 多 种 语言 。 

重点 主题 ”本 版 所 含 主题 可 以 自然 过 渡 到 讲述 计算 机 体系 结构 、 操 作 系统 和 编写 编译 器 
的 后 续 课 程 : 

e 虚拟 机 概念 

。 指令 集 架 构 

e 基本 布尔 运算 

e 指令 执行 周期 

e 内 存 访 问 和 握手 

e 中 断 和 轮 询 

e 基于 硬件 的 IO 

e 浮 点 数 二 进 制 表示 

其 他 主题 则 专门 针对 x86 和 Inte164 架构 : 
e 受 保护 的 内 存 和 分 页 
e 实地 址 模式 的 内 存 分 段 
e 16 位 中 断 处 理 
e。 MS-DOS 和 BIOS 系统 调用 (中 断 ) 
e 浮 点 单元 架构 和 编程 
e 指令 编码 
本 书 中 的 某 些 例 子 还 可 以 用 于 计算 机 科学 课程 体系 中 的 后 续 课 程 : 
。 搜索 与 排序 算法 
e 高 级 语言 结构 
e 有 限 状 态 机 
e 代码 优化 示例 


第 7 版 的 新 内 容 


这 一 版 增加 了 对 程序 示例 的 讨论 ， 添 加 了 更 多 的 复习 题 和 关键 术语 ， 介 绍 了 64 位 编程 ， 
降低 了 对 子 程序 库 的 依赖 性 。 具 体内 容 如 下 : 


VI 


e 本 版 前 面 的 几 章 现在 包含 了 以 64 位 CPU 架构 和 编程 为 主 的 小 节 ， 并 且 还 创建 了 子 

程序 库 的 64 位 版 本 Irvine64。 

e 修改 、 替 换 了 很 多 复习 题 和 练习 ， 部 分 题目 从 章节 内 移动 到 该 章 末 尾 ， 且 习题 分 为 

两 部 分 : 简 答题 和 算法 基础 练习 。 后 者 要 求学 生 编写 一 小 段 代 码 实现 一 个 目标 。 
_。 每 章 有 一 节 为 关键 术语 ， 列 出 了 新 的 术语 和 概念 ， 以 及 新 的 MASM 伪 指令 和 Intel 
指令 。 

e 添加 了 新 的 编程 练习 ， 删 除了 一 些 旧 习 题 ， 并 对 一 些 现 有 的 练习 进行 了 修改 。 

e 本 书 对 作者 子 程序 库 的 依赖 性 大 大 减低 。 鼓 励 学 生 自 己 调用 系统 函数 ， 并 使 用 Visual 

Studio 调试 器 单 步 执行 程序 。Irvine32 和 Irvine64 链接 库 可 以 帮助 学 生 处 理 输入 / 输 
出 ， 但 是 不 强制 要 求 使 用 它们 。 

e 作者 录制 的 新 视频 教程 涵盖 了 本 书 的 基本 内 容 ， 并 已 添加 到 Pearson 网 站 。 

本 书 仍然 关注 其 首要 目标 ， 即 教授 学 生 编写 并 调试 机 器 级 程序 。 它 不 能 代替 计算 机 体系 
结构 的 完整 教材 ， 但 它 确实 在 告诉 学 生计 算 机 工作 原理 的 基础 上 ， 给 出 了 编写 软件 的 第 一 手 
经 验 。 我 们 认为 ， 理 论 联系 实际 能 让 学 生 更 好 地 掌握 知识 。 在 工程 课程 中 ， 学 生 构 建 原型 ; 
在 计算 机 体系 结构 课程 中 ， 学 生 应 编写 机 器 级 程序 。 在 这 些 课程 里 ， 学 生 都 能 获得 难忘 的 经 
验 ， 从 而 有 信心 在 任何 OS/ 面向 机 器 的 环境 中 工作 。 

保护 模式 编程 是 纸 版 章节 (第 1 章 一 第 13 章 ) 的 重 中 之 重 。 因 此 ， 学 生 需 要 在 最 新 版 
本 的 Microsoft Windows 环境 下 创建 并 运行 32 位 和 64 位 程序 。 其 他 4 章 是 电子 版 8， 讲述 
16 位 编程 。 这 些 章 包 含 了 BIOS 编程 、MS-DOS 服务 、 键 盘 和 鼠标 输入 、 视 频 编 程 和 图 形 图 
像 内 容 。 其 中 一 章 为 磁盘 存储 基础 ， 还 有 一 章 为 高 级 DOS 编程 技术 。 

子 程序 库 ”本 书 为 学 生 提供 了 三 个 版 本 的 子 程序 库 ， 用 于 基本 输入 /输出 、 模 拟 、 计 
时 和 其 他 有 用 的 任务 。Irvine32 和 Irvine64 链接 库 运 行 于 保护 模式 。16 位 版 本 的 链接 库 
( Irvine16.lib) 运行 于 实地 址 模式 ， 且 只 用 于 第 14 章 一 第 17 章 8。 这 些 库 的 完整 源 代 码 见于 
配套 的 网 站 。 链 接 库 是 为 了 使 用 方便 ， 而 不 是 为 了 阻止 学 生 学 习 如 何 自行 对 输入 - 输出 编 
程 。 鼓 励 学 生 创 建 自 己 的 链接 库 。 

所 含 软件 与 示例 ”所 有 示例 程序 均 在 Microsoft Visual Studio 2012 下 ， 用 Microsoft 
Macro Assembler Version 11.0 进行 了 验证 。 此 外 ， 还 提供 了 批 处 理 文件 允许 学 生 用 Windows 
命令 行 汇编 和 运行 应 用 程序 。 第 14 章 中 的 32 位 C++ 应 用 程序 已 用 Microsoft Visual C++ 
.NET 测试 。 本 书 的 内 容 更 新 与 勘误 参见 配套 的 网 站 ， 其 中 包括 了 一 些 额 外 的 编程 项 目 ， 老 
师 可 以 在 章节 结束 的 时 候 布置 给 学 生 。 


总 体 目标 


本 书 的 以 下 目标 旨 在 提高 学 生 对 汇编 语言 相关 知识 的 兴趣 并 拓展 知识 面 : 
e Intel 和 AMD 处 理 器 架构 与 编程 ; 

e 实地 址 模式 和 保护 模式 编程 ; 

e 汇编 语言 伪 指 令 、 宏 、 运 算 符 与 程序 结构 ; 


日 、 日、 上 自 这 些 内 容 属于 付费 内 容 , 需要 的 读者 可 向 培 生 教育 出 版 集团 北京 代表 处 购买 ， 电 话 : 010-57355169/ 
57355171， 电 子 邮 件 : service.cn@pearson.com。 一 一 编辑 注 
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e 编程 方法 ， 展 示 了 如 何 用 汇编 语言 创建 系统 级 软件 工具 和 应 用 程序 ; 

e 计算 机 硬件 操作 ; 

e 汇编 语言 程序 、 操 作 系统 和 其 他 应 用 程序 之 间 的 交互 作用 。 

本 书 的 目标 之 一 是 帮助 学 生 以 机 器 级 的 思维 方式 来 处 理 编程 问题 。 将 CPU 视 为 交互 工 
具 ， 学 习 尽 可 能 直接 地 监控 其 操作 是 很 重要 的 。 调 试 器 是 程序 员 最 好 的 朋友 ， 不 仅 可 以 捕捉 
错误 ， 还 可 以 用 作 学 习 CPU 和 操作 系统 的 教学 工具 。 我 们 鼓励 学 生 探查 高 级 语言 的 内 部 机 
制 ， 并 能 意识 到 大 多 数 编程 语言 都 被 设计 为 可 移植 的 ， 因 此 ， 也 独立 于 其 运行 的 主机 。 除 了 
短小 的 示例 外 ， 本 书 还 有 几 百 个 可 运行 的 程序 来 演示 书 中 讲述 的 指令 和 思想 。 本 书 结尾 有 参 
考 资 料 ， 包 括 MS-DOS 中 断 和 指令 助 记 符 指南 。 

背景 知识 ”读者 应 至 少 能 熟练 使 用 一 种 高 级 语言 进行 编程 ， 比 如 Python 、Java、C 或 
C++。 本 书 有 一 章 涉及 C++ 接口 ， 因 此 ， 如 果 手 边 有 编译 器 将 会 非常 有 帮助 。 本 书 不 仅 已 
经 用 于 计算 机 科学 和 管理 信息 系统 专业 课堂 ， 而 且 还 用 于 其 他 工程 课程 。 


特点 


完整 的 程序 清单 ”配套 的 网 站 包含 了 补充 资料 、 学 习 指 南 ， 以 及 本 书 全 部 示例 的 源 代 
码 。 本 书 还 提供 了 丰富 的 链接 库 ， 其 中 包括 30 多 个 过 程 ， 可 以 简化 用 户 输入 -输出 、 数 字 
处 理 、 磁 盘 和 文件 处 理 ， 以 及 字符 串 处 理 。 课 程 初期 ， 学 生 可 以 用 这 个 链接 库 来 改进 自己 编 
写 的 程序 。 之 后 ， 学 生 可 以 自行 编写 过 程 并 将 它们 添加 到 链接 库 中 。 

编程 逻辑 ”本 书 用 两 章 的 篇 幅 重 点 介绍 了 布尔 逻辑 和 位 操作 ， 并 且 有 意识 地 尝试 将 高 级 
编程 逻辑 与 底层 机 器 细节 对 应 起 来 。 这 有 助 于 学 生 创建 更 有 效 的 实现 ， 且 有 助 于 他 们 更 好 地 
理解 编译 器 是 如 何 生 成 目标 代码 的 。 

硬件 和 操作 系统 概念 ”本 书 前 两 章 介 绍 基础 硬件 和 数据 表示 概念 ， 包 括 二 进 制 数 、CPU 
架构 、 状 态 标 志和 内 存 映射 。 概 述 硬件 和 以 历史 的 角度 审视 Intel 处 理 器 系列 可 以 帮助 学 生 
更 好 地 理解 其 目标 计算 机 系统 。 

结构 化 程序 设计 方法 ”从 第 5 章 开始 ， 关 注重 点 为 过 程 和 功能 分 解 。 同 时 ， 提 供 了 更 复 
杂 的 编程 练习 ， 要 求学 生 在 编码 之 前 把 设计 作为 重点 。 

Java 字 节 码 和 Java 虚拟 机 第 8 章 和 第 9 章 解释 了 Java 字 节 码 的 基本 操作 ， 并 给 出 
了 简短 的 演示 例子 。 很 多 短 示例 不 仅 给 出 了 反 汇编 字 节 码 形式 ， 还 给 出 了 详细 的 步 又 解释 。 

磁盘 存储 概念 ”学 生 从 硬件 和 软件 的 角度 学 习 基于 MS-Windows 的 磁盘 存储 系统 的 基 
本 原理 。 

创建 链接 库 ”学 生 不 仅 可 以 自由 地 把 自己 编写 的 过 程 添加 到 本 书 链接 库 ， 还 可 以 创建 新 
的 链接 库 。 他 们 要 学 习 用 工具 箱 方法 进行 编程 ， 并 编写 多 个 程序 可 以 共用 的 代码 。 

宏和 结构 ”本 书 用 一 章 专门 描述 创建 结构 、 联 合 以 及 宏 ， 这些 对 汇编 语言 编程 和 系统 编 
程 是 非常 重要 的 。 条 件 宏和 高 级 运算 符 使 得 宏 更 加 专业 。 

高 级 语言 接口 ”本 书 用 一 章 专 门 描述 汇编 语言 与 C 和 C++ 的 接口 。 对 于 想 要 从 事 高 级 
语言 编程 工作 的 学 生 而 言 ， 这 是 一 项 重要 的 工作 技能 。 他 们 可 以 学 习 代 码 优化 ， 还 可 以 通过 
例子 了 解 C++ 编译 器 是 如 何 优 化 代码 的 。 

教学 辅助 ”所 有 的 程序 清单 都 在 网 上 。 同 时 向 教师 提供 了 测试 库 、 复 习题 答案 、 编 程 练 
习 的 解决 方案 ， 以 及 每 章 的 PPT。 
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章节 说 明 


第 1 章 一 第 9 章 为 汇编 语言 核心 概念 ， 需 要 按 顺 序 学 习 。 后 面 的 章节 则 可 以 自由 选择 。 
下 面 的 章节 示意 图 展示 了 后 续 章 节 与 其 他 章节 知识 之 间 的 依赖 关系 。 





第 1 章 ”基本 概念 : 汇编 语言 的 应 用 、 基 础 概念 、 机 器 语言 和 数据 表示 。 

第 2 章 x86 处 理 器 架构 : 基本 微 计算 机 设计 、 指 令 执 行 周期 、x86 处 理 器 架构 、 
Inte164 架构 、x86 内 存 管理 、 微 计算 机 组 件 、 输 入 - 输出 系统 。 

第 3 章 汇编 语言 基础 : 介绍 汇编 语言 、 链 接 和 调试 、 常 量 和 变量 定义 。 

第 4 章 数据 传送 、 寻 址 和 算术 运算 : 简单 的 数据 传送 和 算术 运算 指令 、 汇 编 -链接 - 
执行 周期 、 运 算 符 、 伪 指令 、 表 达 式 、JMP 和 LOOP 指令 、 间 接 寻 址 。 

第 5 章 ”过程 : 与 外 部 链接 库 的 链接 、 描 述 本 书 链接 库 、 堆 栈 操作 、 过 程 的 定义 和 使 
用 、 流 程 图 、 自 顶 向 下 的 结构 设计 。 

第 6 章 ”条件 处 理 : 布尔 和 比较 指令 、 条 件 跳 转 和 循环 、 高 级 逻辑 结构 、 有 限 状 态 机 。 

第 7 章 整数 运算 : 移 位 和 循环 移 位 指令 及 其 应 用 、 乘 法 和 除法 、 扩 展 加 法 和 减法 、 
ASCII 和 压缩 十 进 制 运算 。 

第 8 章 高 级 过 程 : 堆栈 参数 、 局 部 变量 、 高 级 PROC 和 INVOKE 伪 指 令 、 递 归 。 

第 9 章 字符 串 和 数组 : 字符 串 原 语 、 操 作 字 符 和 整数 数组 、 二 维 数组 、 排 序 和 检索 。 

第 10 章 结构 和 宏 : 结构 、 宏 、 条 件 汇编 伪 指 令 、 定 义 重复 块 。 

第 11 章 MS-Windows 编程 : 保护 模式 内 存 管 理 概 念 、 用 Microsoft-Windows API 显 
示 文 本 和 颜色 ， 动 态 内 存 分 配 。 

第 12 章 浮 点 数 处 理 与 指令 编码 : 浮 点 数 二 进 制 表 示 和 浮 点 运算 。 学 习 IA-32 浮 点 单 
元 编程 。 理 解 IA-32 机 器 指令 编码 。 

第 13 章 高 级 语言 接口 : 参数 传递 规范 、 内 嵌 汇 编 代码 、 将 汇编 语言 模块 链接 到 C 和 
C++ 程序 。 

附录 A MASM 参考 知识 

附录 B x86 指令 集 

附录 C “本 节 回 顾 ” 问 题 答案 

下 面 的 章节 和 附录 由 配套 网 站 提供 9 : 

第 14 章 16 位 MS-DOS 编程 : 内 存 组 织 、 中 断 、 函 数 调 用 、 标 准 MS-DOS 文件 IO 服务 。 

第 15 章 磁盘 基础 知识 : 磁盘 存储 系统 、 扇 区、 徐 、 目 录 、 文 件 分 配 表 、 处 理 MS- 


日 这 些 内 容 属于 付费 内 容 ， 需 要 的 读者 可 向 培 生 教育 出 版 集团 北京 代表 处 购买 ， 电话: 010-57355169/ 
57355171， 电 子 邮 件 : service.cn@pearson.com。 一 一 编辑 注 


DOS 错误 码 、 驱 动 器 和 目录 操作 。 
第 16 章 ”BIOS 编程 : 键盘 输入 、 视 频 文本 、 图 形 、 鼠 标 编程 。 


第 17 章 高 级 MS-DOS 编程 : 自 定义 设计 段 、 运 行 时 程序 结构 、 中 断 处 理 、 用 LO 端 
口 的 硬件 控制 。 


附录 D BIOS 和 MS-DOS 中 断 

附录 E “本 节 回 顾 ” 问 题 答案 (第 14 章 一 第 17 章 ) 
教师 和 学 生 资源 

教师 资源 ° 

下 面 受 保护 的 教师 资源 见 配 套 网 站 www.pearsonhighered.com/irvine: 

@ PPT 讲义 

e 教师 解 题 手册 

学 生 资 源 

学 生 通 过 位 于 www.pearsonhighered.com/irvine 的 出 版 社 网 站 可 以 找到 本 书 作 者 的 网 站 
链接 。 下 述 资 源 位 于 www.asmirvine.com， 且 不 需要 用 访问 卡 : 

e Getting Started (入门 )， 循序渐进 的 完整 教程 ， 帮 助 学 生 设置 Visual Studio 进行 汇编 

语言 编程 。 

e 与 汇编 语言 编程 主题 相关 的 补充 读物 。 

本 书 全 部 示例 程序 的 完整 代码 ， 以 及 作者 补充 链接 库 的 源 代码 。 

e Assembly Language Workbook (汇编 语言 工作 手册 )， 一 个 交互 式 的 工作 手册 ， 其 中 
包括 数值 转换 、 寻 址 模式 、 寄 存 器 使 用 、 调 试 编程 和 浮 点 二 进 制 数 。 内 容 页 面 是 可 
以 自 定 义 的 HTML 文档 ， 帮 助 文件 为 Windows 帮助 格式 。 

e@ 调试 工具 : Microsoft Visual Studio 调试 器 用 法 教程 。 
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ASCII 控制 字符 


下 表 给 出 了 按 下 控制 键 组 合 后 生成 的 ASCII 码 。 助 记 符 和 描述 是 指 用 于 屏幕 和 打印 机 
格式 以 及 数据 通信 的 ASCII 函数 。 


Ascl mr 车 过 
w | | wr | | 1 | cur | Dre | 
0l | CmA | soH | 标题 始 | 1 | cm-Q | Dcl | 设 各 控制 
吕 设备 控制 2 
加 设备 控制 3 
04 | CmD | EOT | 传输 结束 | 14 | carT | pc4 | 设备 控制 4 
0 | cme | EN | | 6 | cmv | NAK | 本 
06 | car | ack | 机 | 1 | cerv | syw | RS 有 
9 | curG | BEL | 咯 闪 ”| 17 | cuw | ers | 人 办 结束 
% | cn | Bs | 格 | Ww | cerw | cAN | 到 
09 | 19 | cery | EM | 媒体 结束 
oA 守 
op | cnrg | vi | eum | 1 | cnr | ssc | a 
oC | cur | FF | 换 页 jj ic | cu | Fs | 文件 分 喇 符 
oD | cm| | 上 | wm | co | Gs | 分 和 
og | CmN | sO | 大 用 名 | IE | cm | Rs | 记录 分 隔 符 
oF | cao | si | hg 天 | iF | cn | Ux | 单元 分 了 和 
@ ASCII 码 为 十 六 进 制 。 
@ ASCII 码 1Fh 为 Ctrl- 连 字符 (-)。 


Alt 组 合 键 
按 住 Alt 键 的 同时 按 下 其 他 键 将 会 产生 的 十 六 进 制 扫描 码 : 


键 扫描 码 扫描 码 | 键 | 扫描 码 
i 


olviw|la|loluls|io|lb|- 
~ 
已 


i 
Ee 和 1 
ee | I 天 本 
= 


键盘 扫描 码 


XI 


通过 对 键盘 输入 二 次 (第 一 次 读 键盘 返回 0 ) 调用 INT 16h 或 INT 21h 可 获得 键盘 扫描 


码 。 所 有 扫描 码 均 为 十 六 进 制 : 


键 
Fl 
F2 
F3 
F4 
FE5 
F6 
REV 
F8 
F9 
F10 
Ell 
F12 


二 


Home 
End 
PgUp 
PgDn 
PrtSc 
Left arrow 
Rt arrow 
Up arrow 
Dn arrow 
Ins 

Del 

Back tab 
Gray 十 
Gary 一 


功能 键 


与 Alt 组 合 
68 
69 
6A 
6B 
6C 
6D 
6E 
6F 
70 


XII 





XIII 


iD 
kt 
[We 
be) 


Ea 
帮 汪 区 加 区 加 区 要 区 为 区 轴 枚 痢 
a 
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Assembly Language for x86 Processors, Seventh Edition 


基本 概念 





本 章 将 建立 汇编 语言 编程 的 一 些 核心 概念 。 比 如 ， 汇 编 语言 是 如 何 适应 各 种 语言 和 应 用 
程序 的 。 本 章 还 将 介绍 虚拟 机 概念 ， 它 在 理解 软件 与 硬件 层 之 间 的 关系 时 非常 重要 。 本 章 还 
用 大 量 的 篇 幅 说 明 二 进 制 和 十 六 进 制 的 数 制 系统 ， 展 示 如 何 执行 转换 和 基本 的 算术 运算 。 本 
章 的 最 后 将 介绍 基础 逻辑 操作 (AND 、OR 和 NOT)， 后 续 章 节 将 证 明 这 些 操作 是 很 重要 的 。 
1.1 欢迎 来 到 汇编 语言 的 世界 

本 书 主要 介绍 与 运行 Microsoft Windows 32 位 和 64 位 系统 的 Intel 和 AMD 处 理 器 相 兼 
容 的 微 处 理 器 编程 。 

配合 本 书 应 使 用 Microsoft 宏 汇编 器 ( 称 为 MASM) 的 最 新 版 本 。Microsoft Visual 
Studio 的 大 多 数 版 本 (专业 版 ， 旗 舰 版 ， 精 简 版 …… ) 都 包含 MASM。 请 访问 我 们 的 网 站 
(asmirvine.com)， 以 便 了 解 Visual Studio 对 MASM 支持 的 最 新 详细 信息 。 同 时 ， 网 站 中 还 
包括 很 多 关于 如 何 设置 软件 并 开始 使 用 的 有 用 信息 。 

在 运行 Microsoft Windows 的 x86 系统 中 ， 其 他 一 些 有 名 的 汇编 器 包括 : TASM (Turbo 
汇编 器 )，NASM (Netwide 汇编 器 ) 和 MASM32 ( MASM 的 一 种 变 体 )。GAS ( GNU 汇编 
器 ) 和 NASM 是 两 种 基于 Linux 的 汇编 器 。 在 这 些 汇编 器 中 ，NASM 的 语法 与 MASM 的 最 
相似 。 

汇编 语言 是 最 古老 的 编程 语言 ， 在 所 有 的 语言 中 ， 它 与 原生 机 器 语言 最 为 接近 。 它 能 直 
接 访问 计算 机 硬件 ， 要 求 用 户 了 解 计 算 机 架构 和 操作 系统 。 

教育 价值 ”为 什么 要 读 这 本 书 ? 也 许 读 者 正在 学 的 大 学 课程 的 名 称 与 下 列 课程 之 一 相 
似 ， 而 这 些 课程 经 常 使 用 这 本 书 : 

e 微 计算 机 汇编 语言 

。 汇编 语言 编程 

e 计算 机 体系 结构 导论 

。 计算 机 系统 基础 

e 扔 入 式 系统 编程 

本 书 有 助 于 学 习 计算 机 体系 结构 、 机 器 语言 和 底层 编程 的 基本 原理 。 读 者 可 以 学 到 足够 
的 汇编 语言 ， 来 测试 其 掌握 的 当今 使 用 最 广泛 的 微 处 理 器 系列 的 知识 。 读 者 不 会 学 到 用 模 
拟 汇编 器 来 编写 一 个 “玩具 ”计算 机 ; MASM 是 一 个 由 业界 专业 人 士 使 用 的 工业 级 汇编 器 。 
读者 将 从 程序 员 的 角度 来 了 解 Intel 处 理 器 系列 的 体系 结构 。 

如 果 读 者 计划 成 为 C 或 C++ 开发 者 ， 就 需要 理解 内 存 、 地 址 和 指令 是 如 何在 底层 工作 
的 。 在 高 级 语言 层次 上 ， 很 多 编程 错误 不 容易 被 识别 。 因 此 ， 程 序 员 经 常会 发 现 需 要 “深入 
到 程序 内 部 ， 才 能 找 出 程序 不 工作 的 原因 。 

如 果 读 者 对 底层 编程 和 学 习 计 算 机 软 硬 件 细节 的 价值 有 所 怀疑 ， 请 注意 以 下 描述 ， 它 引 
用 自首 席 计 算 机 科学 家 Donald Knuth 对 其 著名 丛书 《计算 机 程序 设计 艺术 》 的 讨论 : 
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有 人 说 使 用 机 器 语言 ， 从 根本 上 来 说 ， 是 我 所 犯 的 极 大 错误 。 但 是 我 真 的 认为 ， 只 
有 有 能 力 讨论 底层 细节 ， 才 可 以 为 严肃 的 计算 机 程序 员 写 书 '。 


登录 本 书 网 站 www.asmirvine.com， 可 获取 大 量 的 补充 信息 、 教 程 和 练习 。 
1.1.1 读者 可 能 会 问 的 问题 


需要 怎样 的 背景 知识 ? ”在 阅读 本 书 之 前 ， 读 者 至 少 使 用 过 一 种 结构 化 高 级 语言 进行 编 
程 ， 如 Java、C、Python 或 C++。 需 要 了 解 如 何 使 用 正 语句 、 数 组 和 函数 来 解决 编程 问题 。 
什么 是 汇编 器 和 链接 器 ? “汇编 器 (assembler) 是 一 种 工具 程序 ， 用 于 将 汇编 语言 源 程 
序 转换 为 机 器 语言 。 链 条 器 (linker) 也 是 一 种 工具 程序 ， 它 把 汇编 器 生成 的 单个 文件 组 合 为 
一 个 可 执行 程序 。 还 有 一 个 相关 的 工具 ， 称 为 调试 器 (debugger)， 使 程序 员 可 以 在 程序 运行 
时 ， 单 步 执行 程序 并 检查 寄存 器 和 内 存 状 态 。 
需要 哪些 硬件 和 软件 ? 一 台 运 行 32 位 或 64 位 Microsoft Windows 系统 的 计算 机 ， 并 
已 安装 了 近期 版 本 的 Microsoft Visual Studio。 
MASM 能 创建 哪些 类 型 的 程序 ? 
@ 32 位 保护 模式 ( 32-Bit Protected Mode) : 32 位 保护 模式 程序 运行 于 所 有 的 32 位 和 
64 位 版 本 的 Microsoft Windows 系统 。 它 们 通常 比 实 模式 程序 更 容易 编写 和 理解 。 从 
现在 开始 ， 将 其 简称 为 32 位 模式 。 
e 64 位 模式 (64-Bit Mode): 64 位 程序 运行 于 所 有 的 64 位 版 本 Microsoft Windows 
系统 。 
@ 16 位 实地 址 模式 ( 16-Bit Real-Address Mode) : 16 位 程序 运行 于 32 位 版 本 Windows 
和 骨 人 式 系统 。 由 于 64 位 Windows 不 支持 这 类 程序 ， 本 书 只 限 在 第 14 章 一 第 17 章 
讨论 这 种 模式 。 这 些 章节 是 电子 版 的 ， 可 以 在 出 版 社 网 站 上 获得 。 
本 书 有 哪些 补充 资料 ? ”本 书 网 站 (www.asmirvine.com) 上 有 如 下 资料 : 
@ 汇编 语言 工作 手册 : 一 系列 的 教程 。 
e 64 位 、32 位 和 16 位 编程 的 Irvine 64、Irvine 32 和 Irvine 16 子 程序 库 ， 及 其 完整 源 
代码 。 
e@ 本 书 示例 程序 的 所 有 源 代码 。 
@ 勘误 表 。 
e@ 入门， 帮助 建立 Visual Studio 以 使 用 Microsoft 汇编 器 的 详细 教程 。 
e 关于 高 级 主题 的 文章 ， 限 于 篇 幅 ， 它 们 没有 包含 在 本 书 的 印刷 版 内 。 
@ 在 线 论 坛 的 链接 ， 从 论坛 上 可 以 获得 其 他 使 用 本 书 的 专家 的 帮助 。 
能 学 到 什么 ? ”本 书 将 使 读者 更 好 地 了 解数 据 表示 、 调 试 、 编 程 和 硬件 控制 。 读 者 将 学 到 : 
e x86 处 理 器 应 用 的 计算 机 体系 结构 的 基本 原理 。 
e 基本 布尔 还 辑 ， 以 及 它 是 如 何 应 用 于 编程 和 计算 机 硬件 的 。 
e 使 用 保护 模式 和 虚 模 式 时 ，x86 处 理 器 如 何 管理 内 存 。 
。 高 级 语言 编译 器 (如 C++) 如 何 将 其 语句 转换 为 汇编 语言 和 原生 机 器 代码 。 
e 高 级 语言 如 何在 机 器 级 实现 算术 表达 式 、 循 环 和 逻辑 结构 。 
e 数据 表示 ， 包 括 有 符号 和 无 符号 整数 、 实 数 以 及 字符 数据 。 
e 如 何在 机 器 级 调试 程序 。 使 用 C 和 C++ 语言 时 ， 它 们 生成 的 是 原生 机 器 代码 ， 这 个 
技术 显得 至 关 重 要 。 
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e 应 用 程序 如 何 通过 中 断 处 理 程序 和 系统 调用 与 计算 机 操作 系统 进行 通信 。 

e 如 何 连接 汇编 语言 代码 与 C++ 程序 。 

e 如 何 创建 汇编 语言 应 用 程序 。 

汇编 语言 与 机 器 语言 有 什么 关系 ? 机 器 语言 (machine language) 是 一 种 数字 语言 ， 
专门 设计 成 能 被 计算 机 处 理 器 (CPU ) 理解 。 所 有 x86 处 理 器 都 理解 共同 的 机 器 语言 。 汇 编 
语言 (assembly language) 包含 用 短 助 记 符 如 ADD、MOV、SUB 和 CALL 书写 的 语句 。 汇 
编 语 言 与 机 器 语言 是 一 对 一 (one-to-one) 的 关系 : 每 一 条 汇编 语言 指令 对 应 一 条 机 器 语言 
指令 。 

C++ 和 Java 与 汇编 语言 有 什么 关系 ? ”高 级 语言 如 Python 、C++ 和 Java 与 汇编 语言 
和 机 器 语言 的 关系 是 一 对 多 ( one-to-many)。 比 如 ，C++ 的 一 条 语句 就 会 扩展 为 多 条 汇编 指 
令 或 机 器 指令 。 大 多 数 人 无 法 阅读 原始 机 器 代码 ， 因 此 ， 本 书 探讨 的 是 与 之 最 接近 的 汇编 语 
言 。 例 如 ， 下 面 的 C++ 代码 进行 了 两 个 算术 操作 ， 并 将 结果 赋 给 一 个 变量 。 假 设 X 和 YY 是 
整数 : 

mE 

Es 

与 之 等 价 的 汇编 语言 程序 如 下 所 示 。 这 种 转换 需要 多 条 语句 ， 因 为 每 条 汇编 语句 只 对 应 
一 条 机 器 指令 : 


mov eax,Y ;Y 送 入 EAX 寄存 器 
add eax,4 ;ERX 寄 存 器 内 容 加 4 
movVv ebx,3 ;3 送 入 EBX 寄存 器 
imul ebx 7EAX 与 EBX 相 乘 
mov X,eax ;EAX 的 值 送 入 X 


(寄存 器 ( register) 是 CPU 中 被 命名 的 存储 位 置 ， 用 于 保存 操作 的 中 间 结 果 。) 这 个 例子 
的 重点 不 是 说 明 C++ 与 汇编 语言 哪个 更 好 ， 而 是 展示 它们 的 关系 。 
汇编 语言 可 移植 吗 ? ”一 种 语言 ， 如 果 它 的 源 程 序 能 够 在 各 种 各 样 的 计算 机 系统 中 进行 
编译 和 运行 ， 那 么 这 种 语言 被 称 为 是 可 移植 的 (portable)。 例 如 ， 一 个 C++ 程序 ， 除 非 需要 
特别 引用 某 种 操作 系统 的 库 函 数 ， 否 则 它 就 几乎 可 以 在 任何 一 台 计 算 机 上 编译 和 运行 。Java 
语言 的 一 大 特点 就 是 ， 其 编译 好 的 程序 几乎 能 在 所 有 计算 机 系统 中 运行 。 
汇编 语言 不 是 可 移植 的 ， 因 为 它 是 为 特定 处 理 器 系列 设计 的 。 目 前 广泛 使 用 的 有 多 种 不 
同 的 汇编 语言 ， 每 一 种 都 基于 一 个 处 理 器 系列 。 对 于 一 些 广 为 人 知 的 处 理 器 系列 如 Motorola 
68x00、x86、SUN Sparc、Vax 和 IBM-370， 汇 编 语言 指令 会 直接 与 该 计算 机 体系 结构 相 匹配 ， 
或 者 在 执行 时 用 一 种 被 称 为 微 代码 解释 器 (microcode interpreter) 的 处 理 器 内 置 程序 来 进行 
转换 。 
为 什么 要 学 习 汇编 语言 ? ”如 果 对 学 习 汇 编 语言 还 心 存 疑虑 ， 考 虑 一 下 这 些 观 点 : 
e 如 果 是 学 习 计算 机 工程 ， 那 么 很 可 能 会 被 要 求 写 嵌 入 式 (embedded) 程序 。 舱 人 式 程 
序 是 指 一 些 存 放 在 专用 设备 中 小 容量 存储 器 内 的 短程 序 ， 这 些 专用 设备 包括 : 电话 、 
汽车 燃油 和 点 火 系统 、 空 调控 制 系统 、 安 全 系统 、 数 据 采集 仪器 、 显 卡 、 声 卡 、 硬 
盘 驱动 器 、 调 制 解 调 器 和 打印 机 。 由 于 汇编 语言 占用 内 存 少 ， 因 此 它 是 编写 嵌 人 式 
程序 的 理想 工具 。 
e 处 理 仿 真 和 硬件 监控 的 实时 应 用 程序 要 求 精 确定 时 和 响应 。 高 级 语言 不 会 让 程序 员 
对 编译 器 生成 的 机 器 代码 进行 精确 控制 。 汇 编 语言 则 允许 程序 员 精 确 指定 程序 的 可 





执行 代码 。 
。 电脑 游戏 要 求 软件 在 减少 代码 大 小 和 加 快 执 行 速度 方面 进行 高 度 优化 。 就 针对 一 个 
目标 系统 编写 能 够 充分 利用 其 硬件 特性 的 代码 而 言 ， 游 戏 程序 员 都 是 专家 。 他 们 经 
常 选择 汇编 语言 作为 工具 ， 因 为 汇编 语言 允许 直接 访问 计算 机 硬件 ， 所 以 ， 为 了 提 
高 速度 可 以 对 代码 进行 手工 优化 。 
。 汇编 语言 有 助 于 形成 对 计算 机 硬件 .操作 系统 和 应 用 程序 之 间 交 互 的 全 面 理解 。 使 
用 汇编 语言 ， 可 以 运用 并 检验 从 计算 机 体系 结构 和 操作 系统 课程 中 获得 的 理论 知识 。 
e 一 些 高 级 语言 对 其 数据 表示 进行 了 抽象 ， 这 使 得 它们 在 执行 底层 任务 时 显得 有 些 不 
方便 ， 如 位 控制 。 在 这 种 情况 下 ,程序 员 常常 会 调用 使 用 汇编 语言 编写 的 子 程序 来 
完成 他 们 的 任务 。 
e 硬件 制造 商 为 其 销售 的 设备 创建 设备 驱动 程序 。 设 备 驱动 程序 ( device driver) 是 一 
种 程序 ， 它 把 通用 操作 系统 指令 转换 为 对 硬件 细节 的 具体 引用 。 比 如 ， 打 印 机 制造 
商 就 为 他 们 销售 的 每 一 种 型 号 都 创建 了 一 种 不 同 的 MS-Windows 设备 驱动 程序 。 通 
常 ， 这 些 设备 驱动 程序 包含 了 大 量 的 汇编 语言 代码 。 
汇编 语言 有 规则 吗 ? ”大 多 数 汇编 语言 规则 都 是 以 目标 处 理 器 及 其 机 器 语言 的 物理 局 限 
性 为 基础 的 。 比 如 ，CPU 要 求 两 个 指令 操作 数 的 大 小 相同 。 与 C++ 或 Java 相 比 ， 汇 编 语言 
的 规则 较 少 ， 因 为 ， 前 者 是 用 语法 规则 来 减少 意外 的 逻辑 错误 ， 而 这 是 以 限制 底层 数据 访问 
为 代价 的 。 汇 编 语 言 程序 员 可 以 很 容易 地 绕 过 高 级 语言 的 限制 性 特征 。 例 如 ，Java 就 不 允许 
访问 特定 的 内 存 地 址 ， 程 序 员 可 以 使 用 JNI (Java Native Interface) 类 来 调用 C 函数 绕 过 这 
个 限制 ， 可 结果 程序 不 容易 维护 。 反 之 ， 汇 编 语言 可 以 访问 所 有 的 内 存 地 址 。 但 这 种 自由 的 
代价 也 很 高 : 汇编 语言 程序 员 需 要 花费 大 量 的 时 间 进 行 调试 ! 


1.1.2 ”汇编 语言 的 应 用 


早期 在 编程 时 ， 大 多 数 应 用 程序 部 分 或 全 部 用 汇编 语言 编写 。 它 们 不 得 不 适应 小 内 存 ， 
并 尽 可 能 在 慢 速 处 理 器 上 有 效 运行 。 随 着 内 存 容 量 越 来 越 大 ， 以 及 处 理 器 速度 急速 提高 ， 程 
序 变 得 越 来 越 复 杂 。 程 序 员 也 转向 高 级 语言 如 C、FORTRAN 和 COBOL， 这 些 语言 具有 很 
多 结构 化 能 力 。 最 近 ，Python 、C++、C# 和 Java 等 面向 对 象 语言 已 经 能 够 编写 含 数 百 万 行 
代码 的 复杂 程序 了 。 

很 少 能 看 到 完全 用 汇编 语言 编写 的 大 型 应 用 程序 ， 因 为 它们 需要 花费 大 量 的 时 间 进 行 编 
写 和 维护 。 不 过 ， 汇 编 语 言 可 以 用 于 优化 应 用 程序 的 部 分 代码 来 提升 速度 ， 或 用 于 访问 计算 
机 硬件 。 表 1-1 比较 了 汇编 语言 和 高 级 语言 对 各 种 应 用 类 型 的 适应 性 。 


表 1-1 汇编 语言 与 高 级 语言 的 比较 









最 小 规范 结构 ， 因 此 必须 由 具有 不 同 
规范 结构 使 其 易于 组 织 和 维护 大 量 代码 | 程度 经 验 的 程序 员 来 维护 结构 。 这 导致 
对 已 有 代码 的 维护 困难 


对 硬件 的 访问 直接 且 简 单 。 当 程序 较 
短 且 文 档 良 好 时 易于 维护 


需要 为 每 个 平台 单独 重新 编写 代码 ， 
每 个 汇编 器 都 使 用 不 同 的 语法 。 维 护 困难 


商业 或 科学 应 用 程序 ， 为 单一 
的 中 型 或 大 型 平台 编写 









语言 不 一 定 提供 对 硬件 的 直接 访问 。 
即使 提供 了 ， 可 能 也 需要 难以 控制 的 编 
码 技术 ， 这 导致 维护 困难 
为 多 个 平台 (不 同 的 操作 系 | 通常 可 移植 。 在 每 个 目标 操作 系统 上 ， 
统 ) 编写 的 商业 或 科学 应 用 程序 | 源 程序 只 做 少量 修改 就 能 重新 编译 


硬件 设备 驱动 程序 













誉 太朗 念 5 











高 级 语言 


汇编 语言 






需要 直接 访问 硬件 的 戏 人 式 系 | ”可 能 生成 很 大 的 可 执行 文件 ， 以 至 于 | 理想， 因为 可 执行 代码 小 ， 运 行 速度 
统 和 电脑 游戏 超出 设备 的 内 存 容 量 


C 和 C++ 语言 具有 一 个 独特 的 特性 ， 能 够 在 高 级 结构 和 底层 细节 之 间 进 行 平衡 。 直 接 
访问 硬件 是 可 能 的 ， 但 是 完全 不 可 移植 。 大 多 数 C 和 C++ 编译 器 都 允许 在 其 代码 中 嵌 人 汇 
编 语句 ， 以 提供 对 硬件 细节 的 访问 。 


1.1.3 ”本 节 回 顾 


1. 汇编 器 和 链接 器 是 如 何 一 起 工作 的 ? 

2. 学 习 汇 编 语 言 如 何 能 提高 你 对 操作 系统 的 理解 ? 

3. 比较 高 级 语言 和 机 器 语言 时 ， 一 对 多 关系 是 什么 意思 ? 

4. 解释 编程 语言 中 的 可 移植 性 概念 。 

5. x86 处 理 需 的 汇编 语言 与 Vax 或 Motorola 68x00 等 机 器 的 汇编 语言 是 一 样 的 吗 ? 
6. 举 一 个 嵌入 式 系 统 应 用 程序 的 例子 。 

7. 什么 是 设备 驱动 程序 ? 

8. 汇编 语言 和 C/C++ 语言 中 的 指针 变量 类 型 检查 ， 哪 一 个 更 强 (更 严格 ) ? 

9. 给 出 两 种 应 用 类 型 ， 与 高 级 语言 相 比 ， 它 们 更 适合 使 用 汇编 语言 。 

10. 编写 程序 来 直接 访问 打印 机 端口 时 ， 为 什么 高 级 语言 不 是 理想 工具 ? 

11. 为 什么 汇编 语言 不 常用 于 编写 大 型 应 用 程序 ? 

12. 挑战 : 参考 本 章 前 面 给 出 的 例子 ， 将 下 述 C++ 表达 式 转换 为 汇编 语言 : X= (Y*4 ) + 3。 


1.2 虚拟 机 概念 


虚拟 机 概念 ( virtual machine machine) 是 一 种 说 明 计算 机 硬件 和 软件 关系 的 有 效 方法 。 
在 安德鲁 ' 塔 嫩 鲍 姆 (Andrew Tanenbaum ) 的 书 《 结 构 化 计算 机 组 织 》(Structured Computer 
Organization) 中 可 以 找到 对 这 个 模型 广为人知 的 解释 。 要 说 明 这 个 概念 ， 先 从 计算 机 的 最 
基本 功能 开始 ， 即 执行 程序 。 
计算 机 通常 可 以 执行 用 其 原生 机 器 语言 编写 的 程序 。 这 种 语言 中 的 每 一 条 指令 都 简单 到 
可 以 用 相对 少量 的 电子 电路 来 执行 。 为 了 简便 ， 称 这 种 语言 为 LO。 
由 于 L0 极其 详细 ， 并 且 只 由 数字 组 成 ， 因 此 ， 程 序 员 用 其 编写 程序 就 非常 困难 。 如 果 
能 够 构造 一 种 较 易 使 用 的 新 语言 L1， 那 么 就 可 以 用 L1 编写 程序 。 有 两 种 实现 方法 : 
@ 解释 ( Interpretation) : 运行 L1 程序 时 ， 它 的 每 一 条 指令 都 由 一 个 用 L0 语言 编写 的 
程序 进行 译 码 和 执行 。L1 程序 可 以 立即 开始 运行 , 但 是 在 执行 之 前 ， 必 须 对 每 条 指 
令 进 行 译 码 。 
。 翻译 (Translation): 由 一 个 专门 设计 的 L0 程序 将 整个 L1 程序 转换 为 L0 程序 。 然 后 ， 
得 到 的 L0 程序 就 可 以 直接 在 计算 机 硬件 上 执行 。 
1. 虚拟 机 
与 只 使 用 语言 描述 相 比 ， 把 每 一 层 都 想象 成 有 一 台 假 设 的 计算 机 或 者 虚拟 机 会 更 容易 一 
些 。 通 俗 地 说 ， 虚 拟 机 可 以 定义 为 一 个 软件 程序 ， 用 来 模拟 一 些 其 他 的 物理 或 虚拟 计算 机 
的 功能 。 虚 拟 机 ， 将 其 称 为 VM1， 可 以 执行 L1 语言 编写 的 指令 。 虚 拟 机 VM0 可 以 执行 L0 





虚拟 机 VM1 上 
am 下 


每 一 个 虚拟 机 既 可 以 用 硬件 构成 也 可 以 用 软件 构成 。 程 序 员 可 以 为 虚拟 机 VM1 编写 程 
序 ， 如 果 能 把 VM1 当 作 真 实 计 算 机 予以 实现 ， 那 么 ,程序 就 能 直接 在 这 个 硬件 上 执行 。 否 
则 ， 用 VMI1 写 出 的 程序 就 被 翻译 / 解释 为 VM0 程序 ， 并 在 机 器 VM0 上 执行 。 

机 器 VMI 与 VM0 之 间 的 差异 不 能 太 大 ， 否 则 ， 翻 译 或 解释 花费 的 时 间 就 会 非常 多 。 
如 果 VMI1 语言 对 程序 员 来 说 还 不 够 友好 到 足以 用 于 应 用 程序 的 开发 呢 ? 可 以 为 此 设计 另 一 
个 更 加 易于 理解 的 虚拟 机 VM2。 这 个 过 程 能 够 不 断 重复 ， 直 到 虚拟 机 VMn 足够 支持 功能 强 
大 、 使 用 方便 的 语言 。 

Java 编程 语言 就 是 以 虚拟 机 概念 为 基础 的 。Java 编译 器 把 用 Java 语言 编写 的 程序 翻译 
为 Java 字 节 码 (Java byte code)。 后 者 是 一 种 低级 语言 ， 能 够 在 运行 时 由 Java 虚拟 机 (JVM) 
程序 快速 执行 。JVM 已 经 在 许多 不 同 的 计算 机 系统 上 实现 了 ， 这 使 得 Java 程序 相对 而 言 独 
立 于 系统 。 

2. 特定 的 机 器 Level4 | 高 级 语言 | 

与 实际 机 器 和 语言 相对 ， 用 Level 2 表示 VM2，Level 1 Level3 | 汇编 语言 四 
表示 VM1， 如 图 1-1 所 示 。 计 算 机 数字 逻辑 硬件 表示 为 Level Level2 | 指令 集 架 鬼 (IAS) | 
1 机 器 。 其 上 是 Level 2， 称 为 指令 集 架 构 (ISA，Instruction Levell 
Set Architecture)。 通 常 ， 这 是 用 户 可 以 编程 的 第 一 个 层次 ， TREE 
尽管 这 种 程序 包含 的 是 被 称 为 机 器 语言 的 二 进 制 数值 。 图 1-1 虚拟 机 层次 结构 

指令 集 架 构 ( Level 2 ) 计算 机 芯片 制造 商 在 处 理 器 内 部 设计 一 个 指令 集 来 实现 基本 操 
作 ， 如 传送 、 加 法 或 乘法 。 这 个 指令 集 也 被 称 为 机 器 语言 。 每 一 个 机 器 语言 指令 或 者 直接 在 
机 器 硬件 上 执行 ， 或 者 由 嵌 人 到 微 处 理 器 芯片 的 程序 来 执行 ， 该 程序 被 称 为 微 程序 。 微 程序 
的 讨论 不 在 本 书 范围 内 ， 如 果 想 要 了 解 其 更 多 细节 ， 可 以 参阅 Tanenbaum 的 著作 。 

汇编 语言 (Level 3) 在 ISA 层 ， 编 程 语言 提供 了 一 个 翻译 层 ， 来 实践 大 规模 软件 开 
发 。 汇 编 语言 出 现在 Level3 ， 使 用 短 助 记 符 ， 如 ADD、SUB 和 MOV， 易 于 转换 到 ISA 层 。 
汇编 语言 程序 在 执行 之 前 要 全 部 翻译 (汇编 ) 为 机 器 语言 。 

高 级 语言 ( Level 4 ) Level4 是 高 级 编程 语言 ， 如 C、C++ 和 Java。 这 些 语 言 程序 所 包 
含 的 语句 功能 强大 ， 并 翻译 为 多 条 汇编 语言 指令 。 比 如 ， 查 看 C++ 编译 器 生成 的 列表 文件 
输出 ， 就 可 以 看 到 这 样 的 翻译 。 汇 编 语 言 代码 由 编译 器 自动 汇编 为 机 器 语言 。 


本 节 回 顾 


1. 用 自己 的 话 描述 虚拟 机 概念 。 

2. 为 什么 认为 翻译 的 程序 比 解释 的 程序 执行 起 来 更 快 ? 

3.( 真 / 假 ) : 当 L1 语言 编写 的 解释 程序 运行 时 ， 其 每 一 条 指令 都 由 用 L0 语言 编写 的 程序 进 
行 解码 和 执行 。 

4. 当 处 理 不 同 虚拟 机 层次 的 语言 时 ， 说 明 翻 译 的 重要 性 。 

5. 本 节 给 出 的 虚拟 机 示例 中 ， 汇 编 语言 出 现在 哪 一 层 ? 
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6. 什么 软件 程序 使 得 被 编译 的 Java 程序 能 够 在 几乎 所 有 计算 机 上 运行 ? 
7. 从 低 到 高 ， 说 出 本 节 命 名 的 四 个 虚拟 机 层次 。 

8. 为 什么 程序 员 不 用 机 器 语言 编写 应 用 程序 ? 

9. 图 1-1 中 ， 哪 个 虚拟 机 层次 使 用 机 器 语言 ? 

10. 汇编 语言 虚拟 机 的 语句 被 翻译 为 哪个 层次 的 语句 ? 


1.3 数据 表示 


汇编 语言 程序 员 处 理 的 是 物理 级 数据 ， 因 此 他 们 必须 善于 检查 内 存 和 寄存 器 。 通 常 ， 二 
进 制 数 被 用 于 描述 计算 机 内 存 的 内 容 ; 有 时 也 使 用 十 进 制 和 十 六 进 制 数 。 所 以 必须 熟练 掌握 


数字 格式 ， 以 便 快速 地 进行 数字 的 格式 转换 。 [9 ] 
每 一 种 数 制 格式 或 系统 ， 都 有 一 个 基数 表 1-2 二进制、 八进制 、 十 进 制 和 
(base)， 也 就 是 可 以 分 配给 单一 数字 的 最 大 符号 十 六 进 制 数字 


数 。 表 1-2 给 出 了 数 制 系统 内 可 能 的 数字 ， 这 些 
系统 是 硬件 和 软件 手册 中 最 常 使 用 的 。 在 表 的 最 
后 一 行 ， 十 六 进 制 使 用 的 是 数字 0 到 9， 然 后 字 
母 A 到 F 表 示 十 进 制 数 10 到 15。 在 展示 计算 机 
内 存 的 内 容 和 机 器 级 指令 时 ， 使 用 十 六 进 制 是 相 
当 常 见 的 。 


1.3.1 二 进 制 整数 


计算 机 以 电子 电荷 集合 的 形式 在 内 存 中 保存 指令 和 数据 。 用 数字 来 表示 这 些 内容 就 需要 
系统 能 够 适应 开 / 关 (on/off) 或 真 / 假 (true/false) 的 概念 。 二 进 制 数 (binary number) 用 2 
个 数字 作 基 础 ， 其 中 每 一 个 二 进 制 数字 ( 称 为 位 ，bit) 不 是 0 就 是 1。 位 自 右 向 左 ， 从 0 开 
始 顺 序 增 量 编 号 。 左 边 的 位 称 为 最 高 有 效 位 ( Most Significant Bit，MSB )， 右 边 的 位 称 为 最 
低 有 效 位 (LSB ，least significant bit)。 一 个 16 位 的 二 进 制 数 ， 其 MSB 和 LSB 如 下 图 所 示 : 





MSB LSB 
E0100 
15 0 位 的 序号 


二 进 制 整数 可 以 是 有 符号 的 ， 也 可 以 是 无 符号 的 。 有 符号 整数 又 分 为 正 数 和 负数 ， 
无 符号 整数 默认 为 正 数 ， 零 也 被 看 作 是 正 数 。 在 书写 较 大 的 二 进 制 数 时 ， 有 些 人 喜欢 
每 4 位 或 8 位 插入 一 个 点 号 ， 以 增加 数字 的 易 读 性 。 比 如 ，1101.1110.0011.1000.0000 和 
11001010.10101100。 

1. 无 符号 二 进 制 整数 

从 LSB 开始 ， 无 符号 二 进 制 整数 中 的 每 一 个 位 代表 的 是 2 的 加 1 次 寡 。 下 图 展示 的 是 ， 
对 一 个 8 位 的 二 进 制 数 来 说 ，2 的 寡 是 如 何 从 右 到 左 增加 的 : 





表 1-3 列 出 了 从 2" 到 25 的 十 进 制 值 。 0 





LI 


表 1-3 ”二 进 制 位 的 位 置 对 应 值 











2. 无 符号 二 进 制 整数 到 十 进 制 数 的 转换 

对 于 一 个 包含 个 数字 的 无 符号 二 进 制 整数 来 说 ， 加 权 位 记 数 法 ( weighted positional 
notation) 提供 了 一 种 简便 的 方法 来 计算 其 十 进 制 值 : 

dec=(D, 1X2"")+(D, 2X2" 7) + + (D1X2') + (Dox2") 

D 表示 一 个 二 进 制 数 字 。 比 如 ， 二 进 制 数 00001001 就 等 于 9。 计 算 该 值 时 ， 剔 除了 数 

字 等 于 0 的 位 : 
(1X2’)+(1x2°)=9 
下 图 表示 了 同样 的 计算 过 程 : 


yg 0 让 0 二 01 


3. 无 符号 十 进 制 整数 到 二 进 制 数 的 转换 

将 无 符号 十 进 制 整数 转换 为 二 进 制 ， 方 法 是 不 断 将 这 个 整数 除 以 2， 并 将 每 个 余数 记录 
为 一 个 二 进 制 数字 。 下 表 展 示 的 是 十 进 制 数 37 转换 为 二 进 制 数 的 步 又。 余数 的 数字 ， 从 第 
二 行 开始 ， 分 别 表示 的 是 二 进 制 数字 D。、D,、D,、D;、Ds 和 D;: 





将 表 中 余数 列 的 二 进 制 位 逆序 连接 (D:，D4，… )， 就 得 到 了 该 整数 的 二 进 制 值 100101。 
由 于 计算 机 总 是 按照 8 的 倍数 来 组 织 二 进 制 数字 ， 因 此 在 该 二 进 制 数 的 左边 增加 两 个 0， 形 
成 00100101。 

提示 有 多 少 位 呢 ? 设 无 符号 十 进 制 值 为 n， 其 对 应 的 二 进 制 数 的 位 数 为 b， 用 一 个 
简单 的 公式 就 可 以 计算 出 b: b= (logyn) 的 上 限 。 比 如 ， 如 果 n=17， 则 log,17=4.087 463， 


取 其 上 限 的 最 小 整数 5。 大 多 数 计数 器 没有 以 2 为 底 的 对 数 运算 ， 但 是 有 些 网 页 可 以 帮 
助 实现 这 种 计算 。 





1.3.2 二进制 加 法 
两 个 二 进 制 整数 相 加 时 ， 是 位 对 位 处 理 的 ， 从 最 低 的 一 对 位 (右边 ) 开始 ， 依 序 将 每 一 


大 太 验 


[2 


对 位 进行 加 法 运算 。 两 个 二 进 制 数字 相 加 ， 有 四 种 结果 ， 如 下 所 示 : 


0+0=0 QF l= 





t+0=1 1+1=10 


1 与 1 相 加 的 结果 是 二 进 制 的 10 (等 于 十 进 制 的 2 )。 多 出 来 的 数字 向 更 高 位 产生 一 个 
进位 。 如 下 图 所 示 ， 两 个 二 进 制 数 0000 0100 和 0000 0111 相 加 : 


进位 : 1 


[ojololoslslilole] xn 
er Lie Iw) wl) 


[ole | edo |) | ts 


6 5 4 3 2 jl 0 
位 的 序号 

从 两 个 数 的 最 低位 (位 0) 开始 ， 计 算 0+1， 得 到 底 行 对 应 位 上 的 1。 然 后 计算 次 低位 
(位 1)。 在 位 2 上 ,计算 1+1， 结果 是 0， 并 产生 一 个 进位 1。 然 后 计算 位 3，0+0， 还 要 加 
上 位 2 的 进位 ,结果 是 1。 其 余 的 位 都 是 0。 上 图 右边 是 等 价 的 十 进 制 数值 加 法 (4+7=11 )， 
可 以 用 于 验证 左边 的 二 进 制 加 法 。 

有 些 情 况 下 ， 最 高 有 效 位 会 产生 进位 . 这 时 ， 预 和 留存 储 区 的 大 小 就 显得 很 重要 ， 比 如 ， 
如 果 计 算 1111 1111 加 0000 0001 ， 就 会 在 最 高 有 效 位 之 外 产生 一 个 1， 而 和 数 的 低 8 位 则 为 
全 0。 如 果 和 数 的 存储 大 小 最 少 有 9 位 ， 那 么 就 可 以 将 和 数 表示 为 1 0000 0000。 但 是 ， 如 
果 和 数 只 能 保存 8 位 ,那么 它 就 等 于 0000 0000， 也 就 是 计算 结果 的 低 8 位。 


1.3.3 ”整数 存储 大 小 


在 x86 计算 机 中 ， 所 有 数据 存储 的 基本 单位 都 是 字 节 (byte)， 一 个 字 节 有 8 位 。 其 他 的 
存储 单位 还 有 字 (word) ( 2 个 字 节 )， 双 字 (doubleword) (4 个 字 节 ) 和 四 字 (quadword) (8 
个 字 节 )。 下 图 展示 了 每 个 存储 单位 所 包含 的 位 的 个 数 : 





+ EE 
ni 

ms TT 
八字 4 > ,OF Am 


表 1-4 列 出 了 所 有 无 符号 整数 可 能 的 取 值 范围 。 
大 的 度量 单位 ”对 内 存 和 磁盘 空间 而 言 ， 还 可 以 使 用 大 的 度量 单位 : 

@ 1 千 字 节 (kilobyte) 等 于 2"， 或 1024 个 字 节 。 

e@ 1 兆 字 节 (megabyte)( 1MB) 等 于 2”, 或 1048 576 字 节 。 

e@ 1 吉 字 节 (gigabyte)( 1GB) 等 于 2”， 即 1024*, 或 1073 741 824 字 节 。 

e@ 1 太 字 节 (terabyte)( 1TB) 等 于 2”， 即 1024”, 或 1099 511 627 776 字 节 。 
e@ 1 拍 字 节 (petabyte) 等 于 2”, 或 1 125 899 906 842 624 字 节 。 
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e@ ] 艾 字 节 (exabyte) 等 于 2”, 或 1152 921 504 606 846 976 字 节 。 
@ 1 泽 字 节 (zettabyte) 等 于 2” 个 字 节 。 
e@ 1 尧 字 节 (yottabyte) 等 于 2” 个 字 节 。 


表 1-4 无 符号 整数 类 型 的 取 值 范围 和 大 小 
位 计 的 让 全 大 小 ET 
[az ss | 





oma | 1 | A aa 
FS | on | wm | | | 


1.3.4 十 六 进 制 整数 
大 的 二 进 制 数 读 起 来 很 麻烦 ， 因 此 十 六 进 制 数字 就 提供 了 一 种 简便 的 方式 来 表示 二 进 制 
数据 。 十 六 进 制 整数 中 的 1 个 数字 就 表示 了 4 位 二 进 制 位 ， 两 个 十 六 进 制 数字 就 能 表示 一 个 
字 节 。 一 个 十 六 进 制 数字 表示 的 范围 是 十 进 制 数 0 到 15， 所 以 ,用 字母 A 到 下 来 代表 十 进 
制 数 10 到 15。 表 1-5 列 出 了 每 个 4 位 二 进 制 序列 如 何 转换 为 十 进 制 和 十 六 进 制 数值 。 
表 1-5 二进制、 十 进 制 和 十 六 进 制 等 值 表 








下 面 的 例子 说 明了 二 进 制 数 0001 0110 1010 0111 1001 0100 是 如 何 与 十 六 进 制 数 
16A794 等 价 的 。 


! Eo 4 

0001 [oo | ao | on | ao | oo 

1. 无 符号 十 六 进 制 数 到 十 进 制 的 转换 

十 六 进 制 数 中 ， 每 一 个 数字 位 都 代表 了 16 的 寡 。 这 有 助 于 计算 一 个 十 六 进 制 整数 的 十 
进 制 值 。 假 设 用 下 标 来 对 一 个 包含 4 个 数字 的 十 六 进 制 数 编号 DD,DiDo。 下 式 计算 了 这 个 
整数 的 十 进 制 值 : 

dec=(D;x16)+(D:x16)+(DIx16)+(Dox16) 
这 个 表达 式 可 以 推广 到 任意 位 数 的 十 六 进 制 整 数 : 


dec = (D, 1 X16"')+(D, X16”)+.…+(D,x16')+ (Dox16°) 








一 般 情 况 下 ， 可 以 通过 公式 把 基数 为 B 的 任何 n 位 整数 转换 为 十 进 制 数 : 
dec=(D, 1 XB")+(D, XB”’)+.…+ (DxB')+ (DoxB')。 

比如 ， 十 六 进 制 数 1234 就 等 于 (1x16;)+ (2x16*)+(3x16!)+(4x16")， 也 就 是 
十 进 制 数 4660。 同 样 ， 十 六 进 制 数 3BA4 等 于 (3x16’)+(11x16’)+( 10x16')+(4x16"), 
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也 就 是 十 进 制 数 15 268。 下 图 演示 了 第 二 个 数 转 换 的 计算 过 程 : 


3x16=12228 


11x16:= 2816 
10x16'= 160 
| 4x16"=+ 4 


总 和 : 15 268 


表 1-6 列 出 了 16 的 寡 从 16" 到 16" 的 十 进 制 数值 。 
表 1-6 以 16 为 底 的 替 函 数 的 十 进 制 值 







1 048 576 
16 777 216 
268 435 456 


2, 无 符号 十 进 制 数 到 十 六 进 制 的 转换 
无 符号 十 进 制 整数 转换 到 十 六 进 制 数 的 过 程 是 ， 把 这 个 十 进 制 数 反复 除 以 16， 每 次 取 
余数 作为 一 个 十 六 进 制 数字 。 例 如 ， 下 表 列 出 了 十 进 制 数 422 转换 为 十 六 进 制 的 步骤 : 


422/16 





表 中 ， 余 数列 的 数字 按照 最 后 一 行 到 第 一 行 的 顺序 ， 组 合 为 十 六 进 制 的 结果 。 因 此 本 例 
中 ， 十 六 进 制 结果 就 表示 为 1A6。 同 样 的 算法 也 适用 于 1.3.1 节 中 的 二 进 制 整数 。 如 果 要 将 
十 进 制 数 转换 为 其 他 进 制 数 ， 就 在 计算 时 把 除数 〈 16 ) 换 成 相应 的 基数 。 


1.3.5 十 六 进 制 加 法 


调试 工具 程序 ( 称 为 调试 器 ，debugger) 通常 用 十 六 进 制 表示 内 存 地 址 。 为 了 定位 一 个 
新 地 址 常常 需要 将 两 个 地 址 相 加 。 幸 运 的 是 ， 十 六 进 制 加 法 与 十 进 制 加 法 是 一 样 的 ， 只 需要 
更 换 基数 就 可 以 了 。 

假设 现在 要 将 两 个 数 X 和 YY 相 加 ， 其 基数 为 b。 对 它们 数字 的 编号 从 最 低位 ( xo ) 开 
始 直 到 最 高 位 。 将 X 和 YY 中 对 应 位 x; 和 y, 相 加 得 到 和 值 s;。 如 果 s; > bp， 则 再 计算 s;= (s; 
MOD b)， 并 产生 一 个 进位 1。 当 计算 下 一 对 数字 x;,, 和 yi 的 和 时 ， 将 该 进位 加 入 和 值 。 

比如 ， 现 在 将 两 个 十 六 进 制 数 6A2 和 49A 相 加 。 在 最 低位 上 2+A=12 (十 进 制 数 )， 没 
有 进位 ， 用 十 六 进 制 数 C 表示 这 个 和 值 。 在 中 间 位 上 A+9=19( 十 进 制 数 )， 由 于 19 > 16( 基 
数 )， 因 此 有 进位 。 再 计算 19 MOD 16=3， 并 向 第 3 位 产生 一 个 进位 1。 最 后 ， 在 最 高 位 上 
计算 1+6+4=11 (十 进 制 数 )， 则 在 和 数 的 第 3 位 上 为 十 六 进 制 数 B。 所 以 ， 整 个 和 数 的 十 六 
进 制 数 为 B3C。 
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1.3.6 ”有 符号 二 进 制 整数 


有 符号 二 进 制 整数 有 正 数 和 负数 。 在 x86 处 理 器 中 , MSB 表示 的 是 符号 位 : 0 表示 正 数 ， 
1 表示 负数 。 下 图 展示 了 8 位 的 正 数 和 负数 : 


符号 位 





1. 补 码 表示 


负 整 数 用 补 码 ( two’s-complement) 表示 时 ， 使 用 的 数学 原理 是 : 一 个 整数 的 补 码 是 其 
加 法 道 元 。( 如 果 将 一 个 数 与 其 加 法 逆 元 相 加 ， 结 果 为 0。) 

补 码 表示 法 对 处 理 器 设计 者 来 说 很 有 用 ， 因 为 有 了 它 就 不 需要 用 两 套 独立 的 电路 来 处 理 
加 法 和 减法 。 例 如 ， 如 果 表 达 式 为 4-B， 则 处 理 器 就 可 以 很 方便 地 将 其 转换 为 加 法 表达 式 : 
A+ (-B), 

将 一 个 二 进 制 整数 按 位 取 反 ( 求 补 ) 再 加 1， 就 形成 了 它 的 补 码 。 以 8 位 二 进 制 数 0000 0001 
为 例 ， 求 其 补 码 为 1111 1111， 过 程 如 下 所 示 : 







00000001 
11111110 

11111110 
+00000001 
11111111 


1111 1111 是 -1 的 补 码 。 补 码 操作 是 可 逆 的 ， 因 此 ，1111 1111 的 补 码 就 是 0000 0001。 
六 进 制 数 的 补 码 ”将 一 个 十 六 进 制 整数 按 位 取 反 并 加 1， 就 生成 了 它 的 补 码 。 一 个 简 
单 的 十 六 进 制 数字 取 反 方法 就 是 用 15 减 去 该 数字 。 下 面 是 一 些 十 六 进 制 数 求 补 码 的 例子 : 
6A3D --> 95C2 + 1 --> 95C3 
95C3 --> 6A3C + 1 --> 6A3D 
有 符号 二 进 制 数 到 十 进 制 的 转换 用 下 面 的 算法 计算 一 个 有 符号 二 进 制 整数 的 十 进 制 数 值 : 
e 如 果 最 高 位 是 1， 则 该 数 是 补 码 。 再 次 对 其 求 补 ， 得 到 其 正 数 值 。 然 后 把 这 个 数值 看 
作 是 一 个 无 符号 二 进 制 整数 ， 并 求 它 的 十 进 制 数值 。 
e。 如 果 最 高 位 是 0， 就 将 其 视 为 无 符号 二 进 制 整数 ， 并 转换 为 十 进 制 数 。 
例如 ， 有 符号 二 进 制 数 1111 0000 的 最 高 有 效 位 是 1， 这 意味 着 它 是 一 个 负数 ， 首 先 要 
求 它 的 补 码 ， 然 后 再 将 结果 转换 为 十 进 制 。 过 程 如 下 所 示 : 








第 一 步 : 按 位 取 反 










第 二 步 : 将 上 一 步 得 到 的 结果 加 1 
和 值 : 补 码 表示 








初始 值 11110000 
第 一 步 : 按 位 取 反 00001111 
第 二 步 : 将 上 一 步 得 到 的 结果 加 1 a 
第 三 步 ， 生成 补 码 00010000 
第 四 步 : 转换 为 十 进 制 16 


由 于 初始 值 ( 1111 0000 ) 是 负数 ， 因 此 其 十 进 制 数值 为 -16。 


波 
让 
租 
小 
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有 符号 十 进 制 数 到 二 进 制 的 转换 有 符号 十 进 制 整数 转换 为 二 进 制 的 步骤 如 下 : 

1 ) 把 十 进 制 整数 的 绝对 值 转换 为 二 进 制 数 。 

2 ) 如 果 初 始 十 进 制 数 是 负数 ， 则 在 第 1 步 的 基础 上 ， 求 该 二 进 制 数 的 补 码 。 

比如 ， 十 进 制 数 -43 转换 为 二 进 制 的 过 程 为 : 

1 ) 无 符号 数 43 的 二 进 制 表 示 为 0010 1011。 

2) 由 于 初始 数值 是 负数 ， 因 此 ， 求 出 0010 1011 的 补 码 1101 0101。 这 就 是 十 进 制 
数 -43 的 二 进 制 表示 。 

有 符号 十 进 制 数 到 十 六 进 制 的 转换 ”有 符号 十 进 制 整数 转换 为 十 六 进 制 的 步骤 如 下 : 

1 ) 把 十 进 制 整数 的 绝对 值 转换 为 十 六 进 制 数 。 

2 ) 如 果 初 始 十 进 制 数 是 负数 ， 则 在 第 1 步 的 基础 上 , 求 该 十 六 进 制 数 的 补 码 。 

有 符号 十 六 进 制 数 到 十 进 制 的 转换 有 符号 十 六 进 制 整数 转换 为 十 进 制 的 步骤 如 下 : 

1 ) 如 果 十 六 进 制 整数 是 负数 ， 求 其 补 码 ， 否 则 保持 该 数 不 变 。 

2 ) 把 第 1 步 得 到 的 整数 转换 为 十 进 制 。 如 果 初 始 值 是 负数 ， 则 在 该 十 进 制 整数 的 前 面 
加 负 号 。 


通过 检查 十 六 进 制 数 的 最 高 有 效 (最 高 ) 位 ， 就 可 以 知道 该 数 是 正 数 还 是 负数 。 如 
果 最 高 位 汪 8， 该 数 是 负数 ; 如果 最 高 位 过 7， 该 数 是 正 数 。 比 如 ， 十 六 进 制 数 8A20 是 


负数 ， 而 7FD9 是 正 数 。 


2. 最 大 值 和 最 小 值 
n 位 有 符号 整数 只 用 n-1 来 表示 该 数 的 范围 。 表 1-7 列 出 了 有 符号 单字 节 、 字 、 双 字 、 
四 字 和 八字 的 最 大 值 与 最 小 值 。 
表 1-7 有 符号 整数 类 型 的 范围 与 大 小 
TT 
a | ss | Nm | 








EE | 6 | WA 
| 


1.3.7 ”二进制 减法 


如 果 采 用 与 十 进 制 减法 相同 的 方法 ， 那 么 从 一 个 较 大 的 二 进 制 数 中 减 去 一 个 较 小 的 无 符 
号 二 进 制 数 就 很 容易 了 。 示 例如 下 : 


0 ( 十 进 制 数 13) 
2 ( 十 进 制 数 7) 
位 0 上 的 减法 非常 简单 : 


项 
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14 党 1 尝 
再 下 一 位 上 ， 又 要 向 左边 的 相 邻 位 借 一 位 ， 并 从 2 中 减 去 1: 


人 十 进 制 数 6 


执行 二 进 制 减法 还 有 更 简单 的 方法 ， 即 将 被 减 去 数 的 符号 位 取 反 ， 然 后 将 两 数 相 加 。 这 
个 方法 要 求 用 一 个 额外 的 位 来 保存 数 的 符号 。 现 在 以 刚才 计算 的 (01101-00111 ) 为 例 来 试 
一 下 这 个 方法 。 首 先 ， 将 00111 按 位 取 反 ( 11000 ) 加 1， 得 到 11001。 然 后 ， 把 两 个 二 进 制 
数值 相 加 ， 并 忽略 最 高 位 的 进位 : 


全 (+13) 

Fr (-7) 

00110 (#6) 

结果 正 是 我 们 预期 的 +6。 
1.3.8 字符 存储 


如 果 计 算 机 只 存储 二 进 制 数据 ， 那 么 它 如 何 表 示 字 符 呢 ? 计算 机 使 用 的 是 字符 集 ， 将 字 
符 映 射 为 整数 。 早 期 ， 字 符 集 只 用 8 位 表示 。 即 使 是 现在 ， 在 字符 模式 (如 MS-DOS) 下 运 
行 时 ，IBM 兼容 微机 使 用 的 还 是 ASCII ( 读 为 “askey”) 字符 集 。ASCII 是 美国 标准 信息 交 
换 码 (American Standard Code for Information Interchange) 的 首 字母 缩写 。 在 ASCII 中 ,每 
个 字符 都 被 分 配 了 一 个 独一无二 的 7 位 整数 。 由 于 ASCII 只 用 字 节 中 的 低 7 位 ， 因 此 最 高 
位 在 不 同 计 算 机 上 被 用 于 创建 其 专 有 字符 集 。 比 如 ，IBM 兼容 微机 就 用 数值 128 一 255 来 
表示 图 形 符号 和 和 希腊 字符 。 

ANSI 字符 集 美国 国家 标准 协会 (ANSI) 定义 了 8 位 字符 集 来 表示 多 达 256 个 字符 。 
前 128 个 字符 对 应 标准 美国 键盘 上 的 字母 和 符号 。 后 128 个 字符 表示 特殊 字符 ， 诸 如 国际 字 
母 表 、 重 音符 号 、 货 币 符号 和 分 数 。Microsoft Windows 早期 版 本 使 用 ANSI 字 符 集 。 

Unicode 标准 ”当前 ,计算 机 必须 能 表示 计算 机 软件 中 世界 上 各 种 各 样 的 语言 。 因 此 ， 
Unicode 被 创建 出 来 ， 用 于 提供 一 种 定义 文字 和 符号 的 通用 方法 。 它 定义 了 数字 代码 ( 称 为 
代码 点 〈code point) )， 定 义 的 对 象 为 文字 、 符 号 以 及 所 有 主要 语言 中 使 用 的 标点 符号 ， 包 括 
欧洲 字母 文字 、 中 东 的 从 右 到 左 书 写 的 文字 和 很 多 亚洲 文字 。 代 码 点 转换 为 可 显示 字符 的 格 
式 有 三 种 : 

e UTF-8 用 于 HTML, 与 ASCI 有 相同 的 字 节 数值 。 

e UTF-16 用 于 节约 使 用 内 存 与 高 效 访问 字符 相互 平衡 的 环境 中 。 比 如 ，Microsoft 

Windows 近期 版 本 使 用 了 UTF-16， 其 中 的 每 个 字符 都 有 一 个 16 位 的 编码 。 
e UTF-32 用 于 不 考虑 空间 ， 但 需要 固定 宽度 字符 的 环境 中 。 每 个 字符 都 有 一 个 32 位 
的 编码 。 
ASCII 字符 串 “ 有 一 个 或 多 个 字符 的 序列 被 称 为 字符 串 (string)。 更 具体 地 说 ,一 个 
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ASCII 字符 串 是 保存 在 内 存 中 的 ， 包 含 了 ASCII 代码 的 连续 字 节 。 比 如 ， 字 符 串 “ ABC123” 
的 数字 代码 是 41h、42h、43h、31h、32h 和 33h。 以 空 字 节 结束 (null-terminated) 的 字符 串 
是 指 ， 在 字符 串 的 结尾 处 有 一 个 为 0 的 字 节 。C 和 C++ 语言 使 用 的 是 以 空 字 节 结 束 的 字符 
串 ， 一 些 Windows 操作 系统 函数 也 要 求 字符 串 使 用 这 种 格式 。 

使 用 ASCII 表 ”本 书 文 前 的 表格 列 出 了 在 Windows 控制 台 模 式 下 运行 时 使 用 的 ASCII 
码 。 在 查找 字符 的 十 六 进 制 ASCII 码 时 ， 先 沿 着 表格 最 上 面 一 行 ， 再 找到 包含 要 转换 字符 
的 列 即 可 。 表 格 第 二 行 是 该 十 六 进 制 数值 的 最 高 位 ; 左 起 第 二 列 是 最 低位 。 例 如 ， 要 查找 字 
母 a 的 ASCI 码 ， 先 找到 包含 该 字母 的 列 ， 在 这 一 列 第 二 行 中 找到 第 一 个 十 六 进 制 数 字 6。 
然后 ， 找 到 包含 a 的 行 的 左 起 第 二 列 ， 其 数字 为 1。 因此 ,a 的 ASCII 码 是 十 六 进 制 数 61。 
下 图 用 简单 的 形式 说 明了 这 个 过 程 : 


ASCII 控制 字符 0 一 31 的 字符 代码 被 称 为 ASCII 控制 字符 。 若 程序 用 这 些 代 码 编写 
标准 输出 (比如 C++ 中 )， 控 制 字符 就 会 执行 预先 定义 的 动作 。 表 1-8 列 出 了 该 范围 内 最 常 
用 的 字符 ， 完 整 列 表 参 见 本 书 文 前 。 


表 1-8 ASCII 控制 字符 


ASCII 码 (十 进 制 ) ASCII 码 (十 进 制 ) 
回 退 符 (向 左 移动 一 列 ) | ”12 | 换 页 符 (移动 到 下 一 个 打印 页 ) 


水 平 制 表 符 (向 前 跳 过 n 列 ) “|‖ ”13 | 加 车 符 (移动 到 最 左边 的 输出 列 ) 
换行 符 (移动 到 下 一 个 输出 行 | 《27 | 换 码 符 





数字 数据 表示 术语 用 精确 的 术语 描述 内 存 中 和 显示 屏 上 的 数字 及 字符 是 非常 重要 的 。 
比如 ， 在 内 存 中 用 单字 节 保 存 十 进 制 数 65， 形 式 为 0100 0001。 调 试 程序 可 能 会 将 该 字 节 显 
示 为 “41”， 这 个 数字 的 十 六 进 制 形 式 。 如 果 这 个 字 节 复制 到 显存 中 ， 则 显示 屏 上 可 能 显示 字 
村 A” 因为 在 ASCII 码 中 ，0100 0001 代表 的 是 字母 A。 由 于 数字 的 解释 可 以 依赖 于 它 的 
上 下 文 ， 因 此 ， 下 面 为 每 个 数据 表示 类 型 分 配 一 个 特定 的 名 称 ， 以 便 将 来 的 讨论 更 加 清晰 : 
@ 二 进 制 整数 是 指 ， 以 其 原始 格式 保存 在 内 存 中 的 整数 ， 以 备用 于 计算 。 二 进 制 整数 
保存 形式 为 8 位 的 倍数 (如 8、16、32 或 64 )。 
@ 数字 字符 串 是 一 串 ASCII 字符 ， 例 如 “123” 或 “65”。 这 是 一 种 简单 的 数字 表示 法 ， 
表 1-9 以 十 进 制 数 65 为 例 ， 列 出 了 这 种 表示 法 能 使 用 的 各 种 形式 。 
表 1-9 数字 字符 串 类 型 

















二 进 制 数字 字符 串 十 六 进 制 数字 字符 串 
十 进 制 数字 字符 串 八进制 数字 字符 串 “101” 


1.3.9 本 节 回 顾 


1. 术 语 解 释 : 最 低 有 效 位 (LSB)。 
2. 下 列 无 符号 二 进 制 整数 的 十 进 制 表示 分 别 是 什么 ? 
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a. 11111000 b. 11001010 c. 11110000 
3. 下 列 每 组 二 进 制 整数 的 和 分 别 是 多 少 ? 
a. 00001111 + 00000010 b. 11010101 + 01101011 


c. 00001111 + 00001111 


4. 下 列 每 种 数据 类 型 各 包含 多 少 个 字 节 ? 
a. 字 b. 双 字 c. 四 字 d. 八字 
5. 若 要 表示 下 列 无 符号 十 进 制 整数 ， 则 最 少 需要 几 位 二 进 制 数位 ? 
a. 65 b. 409 c.16385 
6. 写 出 下 列 二 进 制 数 的 十 六 进 制 表示 。 
a. 0011 0101 1101 1010 b. 1100 1110 1010 0011 
人 LTILOLOLILOII 
7. 写 出 下 列 十 六 进 制 数 的 二 进 制 表示 。 


a. A4693FBC b. B697C7Al1 c. 2B3D946]1 


1.4 布尔 表达 式 


布尔 代数 (boolean algebra) 定义 了 一 组 操作 ， 其 值 为 真 (true) 或 假 (false)。 它 的 发 明 
者 是 十 九 世 纪 中 叶 的 数学 家 乔治 ， 布尔 (George Boole)。 在 数字 计算 机 发 明 的 早期 ， 人 们 发 
现 布 尔 代数 可 以 用 来 描述 数字 电路 的 设计 。 同 时 ， 在 计算 机 程序 中 ， 布 尔 表达 式 被 用 来 表示 
逻辑 操作 。 

一 个 布尔 表达 式 ( boolean expression) 包括 一 个 布尔 运算 符 以 及 一 个 或 多 个 操作 数 。 每 
个 布尔 表达 式 都 意味 着 一 个 为 真 或 假 的 值 。 以 下 为 运算 符 集合 : 

e 非 (NOT): 标记 为 -或 ~ 或 

e 与 (AND): 标记 为 ^ 或 ， 

e 或 (OR): 标记 为 v 或 + 

NOT 是 一 元 运算 符 ， 其 他 运算 符 都 是 二 元 的 。 布 尔 表 达 式 的 操作 数 也 可 以 是 布尔 表达 
式 。 示 例如 下 : 


(NOT X) ORY 


NOT (X AND Y) 
X AND (NOTY) 


NOT NOT 运算 符 将 布尔 值 取 反 。 用 数学 符号 书写 为 一 XxX， 其 中 , X 是 一 个 变量 (或 


表达 式 )， 其 值 为 真 (T) 或 假 (F)。 下 表 列 出 了 对 变量 X 进行 NOT 运算 后 所 有 可 能 的 输出 。 
左边 为 输入 ,右边 (阴影 部 分 ) 为 输出 : 





真 值 表 中 ，0 表示 假 ，1 表示 真 。 
AND 布尔 运算 符 AND 需要 两 个 操作 数 ， 用 符号 表示 为 Xx ^Y。 下 表 列 出 了 对 变量 X 
和 YY 进行 AND 运算 后 ， 所 有 可 能 的 输出 (阴影 部 分 ): 





当 两 个 输入 都 是 真 时 ， 输 出 才 为 真 。 这 与 CH 和 Java 的 复合 布尔 表达 式 中 的 逻辑 AND 
是 相对 应 的 。 

汇编 语言 中 AND 运算 符 是 按 位 操作 的 。 如 和 LLLLTITI TDTUTU 
下 例 所 示 , 义 中 的 每 一 位 都 与 Y 中 的 相应 位 进 
行 AND 运算 : 


x: 11111111 ww | 


Ys 00011100 
A Ys 00011100 


如 图 1-2 所 示 ， 结 果 值 0001 1100 中 的 每 一 xy 
位 表示 的 是 X 和 YY 相应 位 的 AND 运算 结果 。 本 
OR 布尔 运算 符 OR 需要 两 个 操作 数 ， 用 符 。。 图 12 殉 个 一 进 制 整数 按 位 AND 运算 
号 表示 为 XvY。 下 表 列 出 了 对 变量 X 和 YY 进行 OR 运算 后 ， 所 有 可 能 的 输出 (阴影 部 分 ): 


AND AND AND AND AND AND AND AND 





当 两 个 输入 都 是 假 时 ， 输 出 才 为 假 。 这 个 真 值 表 与 C++ 和 Java 的 复合 布尔 表达 式 中 的 
逻辑 OR 对 应 。 

OR 运算 符 也 是 按 位 操作 。 在 下 例 中 , X 的 每 一 位 与 Y 的 对 应 位 进行 OR 运算 ,结果 为 
1111 1100: 


x: 11101100 we Er 


Ys 00011100 
XX VY 11111100 OR OR OR OR OR OR OR OR 


如 图 1-3 所 示 ， 每 一 位 都 独立 进行 OR 运 、 
et olw|nl ty lr lel 


运算 符 优 先 级 运算 符 优先 级 原则 ( operator 
precedence rule) 用 于 指示 在 多 运算 符 表达 式 中 ， 
先 执行 哪个 运算 。 在 包含 多 运算 符 的 布尔 表达 式 二 re 
中 ， 优 先 级 是 非常 重要 的 。 如 下 表 所 示 ，NOT 。 图 1 两 个 一 进 制 整数 按 位 OR 运算 
运算 符 具 有 最 高 优先 级 ， 然 后 是 AND 和 OR 运算 符 。 可 以 使 用 括号 来 强制 指定 表达 式 的 求 
值 顺序 : 


表达 式 运算 符 顺 序 
一 XvY NOT, 然后 OR 
— (XAY) OR, 然后 NOT 


XvKAZ) AND, 然后 OR 
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1.4.1 布尔 函数 真 值 表 


布尔 函数 ( Boolean function) 接收 布尔 输入 ， 生 成 布尔 输出 。 所 有 布尔 函数 都 可 以 构造 
一 个 真 值 表 来 展示 全 部 可 能 的 输入 和 输出 。 下 面 的 这 些 真 值 表 都 表示 包含 两 个 输入 变量 X 
和 YY 的 布尔 函数 。 右 侧 的 阴影 部 分 是 函数 输出 : 
示例 1: 一 XvY 


| x | 一 Y | xv] 


示例 2: X^ 一 YY 





示例 3: (YAS)v(X^ 一 S) 


[LXTYTS ls sl sl ve 
es rl 5 Fe 





示例 3 的 布尔 肾 数 描述 了 一 个 多 路 选择 器 ( multiplexer)， 一 种 数字 组 件 ， 利 用 一 个 选择 
位 (S) 在 两 个 输出 (X 和 YY) 中 选择 一 个 。 如 果 S 为 假 ， 函 数 输出 (Z) 就 和 X 相同 ; 如 果 
S 为 真 ， 函 数 输出 就 和 YY 相同 。 下 面 是 多 路 选择 器 的 框图 : 





1.4.2 ”本 节 回 顾 


1. 描述 布尔 表达 式 一 XvY。 
2. 描述 布尔 表达 式 (X^Y)。 
3. 布尔 表达 式 (T^F)vT 的 值 是 什么 ? 
4. 布尔 表达 式 一 (FvT) 的 值 是 什么 ? 
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5. 布尔 表达 式 -Fv ~T 的 值 是 什么 ? 


1.5 本章 小 结 


本 书 侧重 于 使 用 MS-Windows 平台 的 x86 处 理 器 编程 。 内 容 涉及 计算 机 体系 结构 、 机 
器 语言 和 底层 编程 的 基本 原则 。 读 者 将 学 到 足够 的 汇编 语言 来 测试 自己 已 掌握 的 关于 当前 使 
用 最 广 的 微 处 理 器 系列 的 知识 。 

在 阅读 本 书 之 前 ， 读 者 应 至 少 完成 一 门 大 学 计算 机 编程 课程 或 与 之 相当 的 课程 。 

汇编 器 是 一 种 程序 ， 用 于 把 源 程序 从 汇编 语言 转换 为 机 器 语言 。 与 之 配合 的 程序 ， 称 为 
链接 器 ， 把 汇编 器 生成 的 单个 文件 组 合成 一 个 可 执行 程序 。 第 三 种 程序 ， 称 为 调试 器 ， 为 程 
序 员 提供 一 种 途径 来 追踪 程序 的 执行 过 程 ， 并 检查 内 存 的 内 容 。 

本 书 大 部 分 内 容 都 是 关于 32 位 和 64 位 程序 的 ， 如 果 重 点 关注 最 后 四 章 ， 则 是 16 位 
程序 。 

通过 本 书 将 学 习 到 如 下 概念 : 应 用 于 x86 (和 Intel 64 ) 处 理 器 的 基本 计算 机 体系 结构 ; 
基本 布尔 逻辑 ; x86 处 理 器 如 何 管理 内 存 ; 高 级 语言 编译 器 如 何 将 其 语句 转换 为 汇编 语言 
原生 机 器 代码 ; 高 级 语言 如 何在 机 器 级 实现 算术 表达 式 、 循 环 和 逻辑 结构 ; 有 符号 和 无 符号 
整数 、 实 数 和 字符 的 数据 表示 。 

汇编 语言 与 机 器 语言 是 一 对 一 的 关系 ， 即 一 条 汇编 指令 对 应 于 一 条 机 器 指令 。 汇 编 语言 
不 具有 可 移植 性 ， 因 为 它 是 与 具体 处 理 器 系统 绑 定 的 。 

编程 语言 是 一 种 工具 ， 用 于 创建 独立 的 应 用 程序 或 者 部 分 应 用 程序 。 有 些 应 用 程序 ， 如 
设备 驱动 和 硬件 接口 程序 ， 更 适合 使 用 汇编 语言 。 而 其 他 应 用 程序 ， 如 多 平台 商业 和 科学 应 
用 ， 用 高 级 语言 则 更 容易 编写 。 

在 展示 计算 机 体系 结构 中 的 每 一 层 如 何 表示 为 一 个 机 器 抽象 时 ， 虚 拟 机 概念 是 一 种 有 效 
的 方式 。 每 层 可 以 用 硬件 或 软件 构成 ， 其 上 编写 的 程序 可 以 用 其 下 一 层 进行 翻译 或 解释 。 虚 
拟 机 概念 可 以 与 真实 世界 中 的 计算 机 层次 相关 ， 包 括 数字 逻辑 、 指 令 集 架 构 、 汇 编 语言 和 高 
级 语言 。 

二 进 制 和 十 六 进 制 数 对 在 机 器 级 工作 的 程序 员 来 说 ， 是 非常 重要 的 符号 工具 。 因 此 ， 必 
须 理解 如 何 操作 数 制 及 其 之 间 的 转换 ， 以 及 计算 机 怎样 生成 字符 表示 。 

本 章 提出 了 NOT、AND 和 OR 布尔 运算 符 。 一 个 布尔 表达 式 包 括 一 个 布尔 运算 符 以 及 
一 个 或 多 个 操作 数 。 真 值 表 是 一 种 有 效 方法 ， 用 于 展示 布尔 函数 所 有 可 能 的 输入 和 输出 。 


1.6 关键 术语 

ASCII boolean expression (布尔 表达 式 ) 
ASCII control characters (ASCII 控制 字符 ) boolean function (布尔 函数 ) 
ASCII digit string (ASCII 数字 串 ) character set (字符 集 ) 

assembler (汇编 器 ) code interpretation (代码 解释 ) 
assembly language (汇编 语言 ) : code point(Unicode) (代码 点 ) 
binary digit string (二 进 制 数 字 串 ) code translation (代码 翻译 ) 
binary integer (二 进 制 整 数 ) debugger (调试 器 ) 

bit (位 /比特 ) device driver (设备 驱动 程序 ) 


boolean algebra (布尔 代数 ) digit string (数字 串 ) 


kt 
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embedded systems application ( 府 入 式 系统 应 用 ) 
exabyte ( 艾 字 节 ) 

gigabyte ( 吉 字 节 ) 

hexadecimal digit string (十 六 进 制 数 字 串 ) 
hexadecimal integer (十 六 进 制 整数 ) 

unsigned binary integer (无 符号 二 进 制 整数 ) 
UTF-8 

UTF-16 

UTF-32 

virtual machine(VM) (虚拟 机 ) 

high-level language (高 级 语言 ) 

instruction set architecture(IAS) (指令 集 架 构 ) 
Java Native Interface(JNI) (Java 原生 接口 ) 
kilobyte ( 千 字 节 ) 

language portability (语言 的 可 移植 性 ) 

least significant bit(LSB) (最 低 有 效 位 (LSB)) 
machine language (机 器 语言 ) 

megabyte ( 兆 字 节 ) 

microcode interpreter ( 微 代 码 解释 器 ) 
microprogram〔 微 程序 ) 


1.7 复习 题 和 练习 


1.7.1 简 答题 


务 ] 间 


Microsoft Macro Assembler(MASM) ( Microsoft 
宏 汇编 器 ) 

most significant bit(MSB) (最 高 有 效 位 ) 

multiplexer (多 路 选择 器 ) 

null-terminated string (以 空 字 节 结 束 的 字符 串 ) 

octal digit string (八进制 数字 串 ) 

one-to-many relationship (一 对 多 关系 ) 

operator precedence (运算 符 优 先 级 ) 

petabyte ( 拍 字 节 ) 

registers (寄存 器 ) 

signed binary integer (有 符号 二 进 制 整数 ) 

terabyte ( 太 字 节 ) 

Unicode (统一 码 ) 

Unicode Transformation Format(UTF) ( Unicode 
转换 格式 ) 

Virtual machine concept (虚拟 机 概念 ) 

Visual Studio 

yottabyte( 尧 字 节 ) 

zettabyte( 泽 字 节 ) 


1. 在 一 个 8 位 二 进 制 整数 中 ， 哪 一 位 是 最 高 有 效 位 (MSB) ? 


2. 下 列 无 符号 二 进 制 整数 的 十 进 制 表示 分 别 是 什么 ? 


a. 00110101 
b. 10010110 
¢. 11001100 


3. 下 列 每 组 二 进 制 整数 的 和 分 别 是 多 少 ? 


& T0101111 + L110L101i1 
b. i00101i1 + i1111111 
€, 01110101 + 10101100 


4. 计算 二 进 制 减法 ( 0000 1101-0000 0111 )。 
5. 下 列 每 种 数据 类 型 各 包含 多 少 位 ? 
a. 字 b. 双 字 


c. 四 字 


d. 八字 


6. 表示 下 列 无 符号 十 进 制 整数 时 ， 需 要 的 最 少 二 进 制 位 分 别 是 多 少 ? 


a. 4095 b. 65534 
7. 下 列 二 进 制 数 的 十 六 进 制 表示 分 别 是 什么 ? 


c. 42319 


a. 0011 0101 1101 1010 b. 1100 1110 1010 0011 c¢. 1111 1110 1101 1011 


8. 下 列 十 六 进 制 数 的 二 进 制 表示 分 别 是 什么 ? 
a. 0126F9D4 b. 6ACDFA95 


c. F69BDC2A 


9. 下 列 十 六 进 制 整数 的 无 符号 十 进 制 表示 分 别 是 什么 ? 
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a.3A b. 1BF c. 1001 
10. 下 列 十 六 进 制 整数 的 无 符号 十 进 制 表 示 分 别 是 什么 ? 
a. 62 b. 4B3 c. 29F 
11. 下 列 有 符号 十 进 制 整数 的 16 位 十 六 进 制 表示 分 别 是 什么 ? 
a. 一 24 b. -331 
12. 下 列 有 符号 十 进 制 整数 的 16 位 十 六 进 制 表示 分 别 是 什么 ? 
a. —21 b. —45 
13. 将 下列 16 位 十 六 进 制 有 符号 整数 转换 为 十 进 制 数 。 
a. 6BF9 bsG123 
14. 将 下 列 16 位 十 六 进 制 有 符号 整数 转换 为 十 进 制 数 。 
a. 4CD2 b. 8230 
15. 下 列 有 符号 二 进 制 数 的 十 进 制 表示 分 别 是 什么 ? 
a, 10110101 b. 00101010 c. 11110000 
16. 下 列 有 符号 二 进 制 数 的 十 进 制 表示 分 别 是 什么 ? 
a. 10000000 b. 11001100 c. 10110111 
17. 下 列 有 符号 十 进 制 整数 的 8 位 二 进 制 ( 补 码 ) 表示 分 别 是 什么 ? 
和 一 9 b. —42 & =16 
18. 下 列 有 符号 十 进 制 整数 的 8 位 二 进 制 ( 补 码 ) 表示 分 别 是 什么 ? 
人 b. 一 98 .26 
19. 下 列 每 组 十 六 进 制 整数 的 和 分 别 是 多 少 ? 
a. 6B4 + 3FE b. A49 + 6BD 
20. 下 列 每 组 十 六 进 制 整数 的 和 分 别 是 多 少 ? 
a.7C4 + 3BE b. B69 + 7AD 


21. ASCII 字符 大 写 “B” 的 十 六 进 制 和 十 进 制 表示 分 别 是 什么 ? 

22. ASCII 字符 大 写 “G” 的 十 六 进 制 和 十 进 制 表示 分 别 是 什么 ? 

23. 挑战 : 129 位 无 符号 整数 能 表示 的 最 大 十 进 制 值 是 多 少 ? 

24. 挑战 : 86 位 有 符号 整数 能 表示 的 最 大 十 进 制 值 是 多 少 ? 

25. 构造 一 个 真 值 表 ， 表 示 布 尔 函 数 一 (A^B) 所 有 可 能 的 输入 和 输出 。 

26. 构造 一 个 真 值 表 ， 表 示 布 尔 函数 (一 A^ 一 B) 所 有 可 能 的 输入 和 输出 。 说 明 此 表 与 25 题 真 值 表 中 
最 右 列 之 间 的 关系 。 听 说 过 摩根 定理 吗 ? 

27. 如 果 一 个 布尔 函数 有 4 个 输入 ， 则 其 真 值 表 需 要 多 少 行 ? 

28. 4 输入 的 多 路 选择 器 需要 多 少 个 选择 位 ? 


1.7.2 算法 基础 


下 列 编程 练习 可 以 选择 任何 高 级 编程 语 

准 C 库 中 的 sprinf 和 sscanf 函数 。) 

1. 编写 一 个 函数 来 接收 一 个 16 位 二 进 制 整数 字符 串 。 函 数 返 回 值 为 该 字符 串 的 整数 值 。 

2. 编写 一 个 函数 来 接收 一 个 32 位 十 六 进 制 整数 字符 串 。 函 数 返 回 值 为 该 字符 串 的 整数 值 。 

3. 编写 一 个 函数 来 接收 一 个 整数 。 函 数 返回 值 必须 是 包含 该 整数 二 进 制 表 示 的 字符 串 。 

4. 编写 一 个 函数 来 接收 一 个 整数 。 函 数 返 回 值 必须 是 包含 该 整数 十 六 进 制 表示 的 字符 串 。 

5. 编写 一 个 函数 实现 两 个 以 b 为 基数 的 数字 串 相 加 ， 其 中 2 < b < 10。 每 个 字符 串 可 包含 多 达 1000 
个 数字 。 函 数 返 回 和 数 ， 其 形式 为 基数 相同 的 字符 串 。 

6. 编写 一 个 函数 实现 两 个 十 六 进 制 字符 串 相 加 ， 每 个 字符 串 含 1000 个 数字 。 函 数 返回 一 个 十 六 进 制 
字符 串 来 表示 输入 之 和 。 


mh 


。 不 要 调用 已 有 的 库 函 数 来 自动 完成 这 些 任务 。( 比如 标 
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7. 编写 一 个 函数 实现 一 个 长 度 为 1000 位 的 十 六 进 制 数字 串 与 单个 位 的 十 六 进 制 数字 的 乘法 。 函 数 返 
回 一 个 十 六 进 制 字符 串 来 表示 乘积 。 

8. 编写 一 个 Java 程序 实现 如 下 计算 ， 然 后 用 Javap -c 指令 对 代码 进行 反 汇编 。 为 每 行 代码 添加 注释 ， 
以 说 明 该 行 代码 的 目的 。 
4 Ys 
int X= (Y + 4) * 3; 

9. 设计 无 符号 二 进 制 整数 减法 。 用 ( 1000 1000-0000 0101=1000 0011 ) 来 检验 该 方法 。 再 用 至 少 两 组 
其 他 的 整数 来 检验 该 方法 ， 每 组 都 是 从 较 大 数 中 减 去 较 小 数 。 


本 章 尾 注 


1. Donald Knuth，MMIX，4 RISC Computer for the New Millennium， 麻 省 理工 学 院 讲 座 记 录 ，1999 年 
12 月 30 日 。 
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本 章 重点 是 与 x86 汇编 语言 相关 的 底层 硬件 。 有 说 法 认为 ， 汇 编 语言 是 直接 与 机 器 交流 
的 理想 软件 工具 。 如 果 是 真 的 ， 那 么 汇编 程序 员 就 必须 非常 熟悉 处 理 器 的 内 部 结构 与 功能 。 
本 章 将 讨论 指令 执行 时 处 理 器 内 部 发 生 的 一 些 基 本 操作 ， 以 及 操作 系统 如 何 加 载 和 执行 程序 ， 
并 通过 样本 主板 布局 来 了 解 x86 系统 的 硬件 环境 ， 最 后 还 讨论 了 在 应 用 程序 与 操作 系统 之 间 ， 
层次 化 输入 输出 是 如 何 工 作 的 。 本 章 所 有 主题 为 开始 编写 汇编 语言 程序 提供 了 硬件 基础 。 


2.1 一 般 概念 


本 章 描述 了 x86 处 理 器 系列 架构 ， 以 及 从 程序 员 角 度 看 到 的 主机 系统 。 其 中 包括 了 所 有 
的 Intel IA-32 和 Intel 64 处 理 器 ， 如 奔腾 ( Intel Pentium) 和 酷 窒 双核 ( Core-Duo) 处 理 器 ， 
还 包括 了 高 级 微 设备 ( AMD) 处 理 器 ， 如 速 龙 ( Athlon)、 弈 龙 (Phenom)、 插 龙 (Opteron) 
和 AMD64。 汇 编 语言 是 学 习 计 算 机 如 何 工作 的 很 好 的 工具 ， 它 需要 读者 具备 计算 机 硬件 的 
工作 知识 。 为 此 ， 本 章 的 概念 和 详细 信息 将 帮助 程序 员 理 解 自己 所 写 的 汇编 代码 。 

本 章 在 所 有 处 理 器 都 使 用 的 概念 与 x86 处 理 器 特点 之 间 进 行 了 平衡 。 程 序 员 将 来 可 能 要 
面 对 各 种 类 型 的 处 理 器 ， 因 此 ， 本 章 呈 现 的 是 通用 概念 。 同 时 ， 为 了 避免 对 机 器 架构 形成 肤 
浅 的 认 知 ， 本 章 也 关注 x86 处 理 器 的 特性 ， 以 便 具备 汇编 编程 的 坚实 基础 。 


若 希望 了 解 更 多 Intel IA-32 架构 ， 请 参阅 《Intel 64 与 IA-32 架构 软件 开发 手册 》 的 
类 1: 基础 架构 (Intel 64 and 14-32 Architectures Software Developer’S Manual, Volume 1: 





Basic Architecture) 。 该 文档 可 以 从 Intel 网 站 免费 下 载 (www.intel.com )。 


2.1.1 基本 微机 设计 


2-1 给 出 了 假想 机 的 基本 设计 。 中 央 处 理 单元 (CPU) 是 进行 算术 和 逻辑 操作 的 部 件 ， 
包含 了 有 限 数量 的 存储 位 置 一 一 寄存 器 ( register)， 一 个 高 频 时 钟 、 一 个 控制 单元 和 一 个 算 
术 逻 辑 单 元 。 

数据 总 线 ，I/O 总 线 





2-1 微 计算 机 框图 
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e 时 钟 (clock) 对 CPU 内 部 操作 与 系统 其 他 组 件 进行 同步 。 

@ 控制 单元 (control unit，CU) 协调 参与 机 器 指令 执行 的 步骤 序列 。 

@ 算术 罗 辑 单元 (arithmetic logic unit，ALU) 执行 算术 运算 ， 如 加 法 和 减法 ， 以 及 逻 

辑 运算 ， 如 AND (与 )、 OR (或 ) 和 NOT ( 非 )。 

CPU 通过 主板 上 CPU 插座 的 引 脚 与 计算 机 其 他 部 分 相连 。 大 部 分 引 脚 连接 的 是 数据 总 
线 、 控 制 总 线 和 地 址 总 线 。 内 存 存 储 单元 (memory storage unit) 用 于 在 程序 运行 时 保存 指 
令 与 数据 。 它 接受 来 自 CPU 的 数据 请 求 ， 将 数据 从 随机 存储 器 (RAM) 传输 到 CPU， 并 从 
CPU 传输 到 内 存 。 由 于 所 有 的 数据 处 理 都 在 CPU 内 进行 ， 因 此 保存 在 内 存 中 的 程序 在 执行 
前 需要 被 复制 到 CPU 中 。 程 序 指令 在 复制 到 CPU 时 ， 可 以 一 次 复制 一 条 ， 也 可 以 一 次 复制 
多 条 。 

总 线 (bus) 是 一 组 并 行 线 ， 用 于 将 数据 从 计算 机 一 个 部 分 传送 到 另 一 个 部 分 。 一 个 计算 
机 系统 通常 包含 四 类 总 线 : 数据 类 、LIO 类 、 控 制 类 和 地 址 类 。 数 据 总 线 ( data bus) 在 CPU 
和 内 存 之 间 传 输 指令 和 数据 。1/O 总 线 在 CPU 和 系统 输入 /输出 设备 之 间 传 输 数据 。 控 制 总 
线 (control bus) 用 二 进 制 信号 对 所 有 连接 在 系统 总 线 上 设备 的 行为 进行 同步 。 当 前 执行 指 
令 在 CPU 和 内 存 之 间 传 输 数据 时 ， 地 址 总 线 (address bus) 用 于 保持 指令 和 数据 的 地 址 。 

时 钟 ”与 CPU 和 系统 总 线 相关 的 每 一 个 操作 都 是 由 一 个 恒定 速率 的 内 部 时 钟 脉冲 来 进 
行 同步 。 机 器 指令 的 基本 时 间 单 位 是 机 器 周期 (machine cycle) 或 时 钟 周期 ( clock cycle)。 
一 个 时 钟 周 期 的 时 长 是 一 个 完整 时 钟 脉 冲 所 需要 的 时 间 。 下 图 中 ， 一 个 时 钟 周期 被 描绘 为 两 
个 相 邻 下 降 沿 之 间 的 时 间 : 


一 个 周期 
1 


de et ee 


时 钟 周期 持续 时 间 用 时 钟 速度 的 倒数 来 计算 ,而 时 钟 速度 则 用 每 秒 振荡 数 来 衡量 。 例 
如 ,一 个 每 秒 振荡 10 亿 次 〈1GHz) 的 时 钟 ， 其 时 钟 周期 为 10 亿 分 之 1 秒 ( 1 纳 秒 )。 

执行 一 条 机 器 指令 最 少 需要 1 个 时 钟 周 期 ， 有 几 个 需要 的 时 钟 则 超过 了 50 个 (比如 
8088 处 理 器 中 的 乘法 指令 )。 由 于 在 CPU 、 系 统 总 线 和 内 存 电路 之 间 存 在 速度 差异 ， 因 此 ， 
需要 访问 内 存 的 指令 常常 需要 空 时 钟 周期 ， 也 被 称 为 等 待 状态 (wait states ) 。 
2.1.2 ”指令 执行 周期 

一 条 机 器 指令 不 会 神奇 地 一 下 就 执行 完成 。CPU 在 执行 一 条 机 器 指令 时 ， 需 要 经 过 一 
系列 预先 定义 好 的 步 又， 这 些 步 又 被 称 为 指令 执行 周期 (instruction execution cycle)。 假 设 
现在 指令 指针 寄存 器 中 已 经 有 了 想 要 执行 指令 的 地 址 ， 下 面 就 是 执行 步骤 : 

1 ) CPU 从 被 称 为 指令 队列 〈instruction queue) 的 内 存 区 域 取 得 指令 ， 之 后 立即 增加 指 
令 指针 的 值 。 

2 ) CPU 对 指令 的 二 进 制 位 模式 进行 译 码 。 这 种 位 模式 可 能 会 表示 该 指令 有 操作 数 ( 输 
入 值 )。 

3 ) 如 果 有 操作 数 ，CPU 就 从 寄存 器 和 内 存 中 取得 操作 数 。 有 时 ， 这 步 还 包括 了 地 址 
计算 。 

4) 使 用 步骤 3 得 到 的 操作 数 ，CPU 执行 该 指令 。 同 时 更 新 部 分 状态 标志 位 ， 如 零 标志 
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(Zero)、 进 位 标志 (Carry) 和 溢出 标志 (Overflow ) 。 

5 ) 如 果 输 出 操作 数 也 是 该 指令 的 一 部 分 ， 则 CPU 还 需要 存放 其 执行 结果 。 

通常 将 上 述 听 起 来 很 复杂 的 过 程 简 化 为 三 个 步骤 : 取 指 (Fetch)、 译 码 (Decode) 和 执 
行 (Execute)。 操 作 数 (operand) 是 指 操作 过 程 中 输入 或 输出 的 值 。 例 如 ， 表 达 式 Z=X+Y 
有 两 个 输入 操作 数 (X 和 站)， 一 个 输出 操作 数 (Z)。 

图 2-2 是 一 个 典型 CPU 中 的 数据 流 
框图 。 该 图 表现 了 在 指令 执行 周期 中 相 
互 交互 部 件 之 间 的 关系 。 在 从 内 存 读 取 
程序 指令 之 前 ， 将 其 地 址 放 到 地 址 总 线 
上 。 然 后 ， 内 存 控制 器 将 所 需 代 码 送 到 
数据 总 线 上 ， 存 入 代码 高 速 缓存 ( code 
cache)。 指 令 指 针 的 值 决定 下 一 条 将 要 
执行 的 指令 。 指 令 由 指令 译 码 器 分 析 ， 
并 产生 相应 的 数值 信号 送 往 控制 单元 ， 
其 协调 ALU 和 浮 点 单元 。 虽 然 图 中 没 
有 画 出 控制 总 线 ， 但 是 其 上 传输 的 信和 号 
用 系统 时 钟 协调 不 同 CPU 部 件 之 间 的 数 
据 传输 。 图 2-2 简化 的 CPU 框图 


2.1.3 读 取 内 存 


作为 一 个 常见 现象 ， 计 算 机 从 内 存 读 取 数 据 比 从 内 部 寄存 器 读 取 速度 要 慢 很 多 。 这 是 因 
为 从 内 存 读 取 一 个 值 ， 需 要 经 过 下 述 步骤 : 

1 ) 将 想 要 读 取 的 值 的 地 址 放 到 地 址 总 线 上 。 

2 ) 设置 处 理 器 RD ( 读 取 ) 引 脚 (改变 RD 的 值 )。 

3 ) 等 待 一 个 时 钟 周期 给 存储 器 芯片 进行 响应 。 

4) 将 数据 从 数据 总 线 复制 到 目标 操作 数 。 

上 述 每 一 步 常 常 只 需要 一 个 时 钟 周期 ， 时 钟 周期 是 基于 处 理 器 内 固定 速率 时 钟 节拍 的 一 
种 时 间 测 量 方法 。 计 算 机 的 CPU 通常 是 用 其 时 钟 速 率 来 描述 。 例 如 ， 速 率 为 1.2GHz 意味 
着 时 钟 节拍 或 振荡 为 每 秒 12 亿 次 。 因 此 ， 考 虑 到 每 个 时 钟 周期 仅 为 1 200 000 000 秒 ，4 
个 时 钟 周 期 也 是 非常 快 的 。 但 是 ， 与 CPU 寄存 器 相 比 ， 这 个 速度 还 是 慢 了 ， 因 为 访问 寄存 
器 一 般 只 需要 1 个 时 钟 周期 。 

幸运 的 是 ，CPU 设计 者 很 早 之 前 就 已 经 指出 ， 因 为 绝 大 多 数 程序 都 需要 访问 变量 ， 计 算 
机 内 存 成 为 了 速度 瓶颈 。 他 们 想 出 了 一 个 聪明 的 方法 来 减少 读 写 内 存 的 时 间 一 一 将 大 部 分 近 
期 使 用 过 的 指令 和 数据 存放 在 高 速 存 储 器 cache 中 。 其 思想 是 ,程序 更 可 能 希望 反复 访问 相 
同 的 内 存 和 指令 ， 因 此 ，cache 保存 这 些 值 就 能 使 它们 能 被 快速 访问 到 。 此 外 ， 当 CPU 开始 
执行 一 个 程序 时 ， 它 会 预先 将 后 续 (比如 ) 一 千 条 指令 加 载 到 cache 中 ， 这 个 行为 是 基于 这 样 
一 种 假设 ， 即 这 些 指 令 很 快 就 会 被 用 到 。 如 果 这 种 情况 重复 发 生 在 一 个 代码 块 中 ， 则 cache 
中 就 会 有 相同 的 指令 。 当 处 理 器 能 够 在 cache 存储 器 中 发 现 想 要 的 数据 ， 则 称 为 cache 命中 
(cache hit)。 反 之 ， 如 果 CPU 在 cache 中 没有 找到 数据 ， 则 称 为 cache 未 命中 (cache miss ) 。 

x86 系列 中 的 cache 存储 器 有 两 种 类 型 : 一 级 cache (或 主 cache) 位 于 CPU 上 ; 二 级 
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cache (或 次 cache) 速度 略 慢 ， 通 过 高 速 数据 总 线 与 CPU 相连 。 这 两 种 cache 以 最 佳 方式 一 
起 工作 。 

还 有 一 个 原因 使 得 cache 存储 器 比 传统 RAM 速度 快 一 一 cache 存储 器 是 由 一 种 被 称 为 
静态 RAM (static RAM) 的 特殊 存储 器 芯片 构成 的 。 这 种 芯片 比较 贵 ， 但 是 不 需要 为 了 保持 
其 内 容 进行 不 断 地 刷新 。 另 一 方面 ， 传 统 存储 器 ， 即 动态 RAM ( dynamic RAM)， 就 需要 持 
续 刷 新 。 它 速度 慢 一 些 ， 但 是 价格 更 便宜 。 


2.1.4 加 载 并 执行 程序 


在 程序 执行 之 前 ， 需 要 用 一 种 工具 程序 将 其 加 载 到 内 存 ， 这 种 工具 程序 称 为 程序 加 载 器 
(program loader) 。 加 载 后 ， 操 作 系统 必须 将 CPU 指向 程序 的 入 口 ， 即 程序 开始 执行 的 地 址 。 
以 下 步骤 是 对 这 一 过 程 的 详细 分 解 。 

e 操作 系统 (OS) 在 当前 磁盘 目录 下 搜索 程序 的 文件 名 。 如 果 找 不 到 ， 则 在 预定 目录 
列表 ( 称 为 路 径 (path)) 下 搜索 文件 名 。 当 OS 无 法 检索 到 文件 名 时 ， 它 会 发 出 一 个 
出 错 信息 。 

e 如 果 程 序 文件 被 找到 ，OS 就 访问 磁盘 目录 中 的 程序 文件 基本 信息 ， 包 括 文件 大 小 ， 
及 其 在 磁盘 驱动 器 上 的 物理 位 置 。 

e OS 确定 内 存 中 下 一 个 可 使 用 的 位 置 ， 将 程序 文件 加 载 到 内 存 。 为 该 程序 分 配 内 存 
块 ， 并 将 程序 大 小 和 位 置信 息 加 入 表 中 (有 时 称 为 描述 符 表 ( descriptor table) ) 。 另 
外 ，OS 可 能 调整 程序 内 指针 的 值 ， 使 得 它们 包括 程序 数据 地 址 。 

e OS 开始 执行 程序 的 第 一 条 机 器 指令 (程序 人 口 )。 当 程序 开始 执行 后 ， 就 成 为 一 个 进 
程 (process)。0OS 为 这 个 进程 分 配 一 个 标识 号 (进程 ID )， 用 于 在 执行 期 间 对 其 进行 
追踪 。 

e 进程 自动 运行 。OS 的 工作 是 追踪 进程 的 执行 ， 并 响应 系统 资源 的 请 求 。 这 些 资源 包 
括 内 存 、 磁 盘 文件 和 输入 输出 设备 等 。 

e 进程 结束 后 ， 就 会 从 内 存 中 移 除 。 


提示 不 论 使 用 哪个 版 本 的 Microsoft Windows， 按 下 Ctrl-Alt-Delete 组 合 键 ， 可 
以 选择 任务 管理 器 (task manager) 选项 。 在 任务 管理 器 窗口 可 以 查看 应 用 程序 和 进程 列 
表 。 应 用 程序 列表 中 列 出 了 当前 正在 运行 的 完整 程序 名 称 ， 比 如 ，Windows 浏览 器 ， 或 
者 Microsoft Visual C++。 如 果 选 择 进程 列表 ， 则 会 看 见 一 长 串 进 程 名 。 其 中 的 每 个 进 
程 都 是 一 个 独立 于 其 他 进程 的 ， 并 处 于 运行 中 的 小 程序 。 可 以 连续 追踪 每 个 进程 使 用 的 
CPU 时 间 和 内 存 容 量 。 在 某 些 情况 下 ， 选 定 一 个 进程 名 称 后 ， 按 下 Delete 键 就 可 以 关闭 
该 进程 。 










2.1.5 本 节 回 顾 


1. 中 央 处 理 单元 (CPU) 包含 寄存 器 和 哪些 其 他 基本 部 件 ? 

2. 中 央 处 理 单元 通过 哪 三 种 总 线 与 计算 机 系统 的 其 他 部 分 相连 ? 

3. 为 什么 访问 存储 器 比 访问 寄存 器 要 花费 更 多 的 机 器 周期 ? 

4. 指令 执行 周期 包含 哪 三 个 基本 步骤 ? 

5. 指令 执行 周期 中 ， 如 果 用 到 存储 器 操作 数 ， 则 还 需要 哪 两 个 步骤 ? 
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2.2 32 位 x86 处 理 器 


本 节 重 点 在 于 所 有 x86 处 理 器 的 基本 架构 特点 。 这 些 处 理 器 包括 了 Intel IA-32 系列 中 的 
成 员 和 所 有 32 位 AMD 处 理 器 。 


2.2.1 操作 模式 


x86 处 理 器 有 三 个 主要 的 操作 模式 : 保护 模式 、 实 地 址 模式 和 系统 管理 模式 ; 以 及 一 个 
子 模式 : 虚拟 8086 ( virtual-8086 ) 模式 ， 这 是 保护 模式 的 特殊 情况 。 以 下 是 对 这 些 模式 的 
简介 : 

保护 模式 ( Protected Mode) 保护 模式 是 处 理 器 的 原生 状态 ， 在 这 种 模式 下 ， 所 有 的 
指令 和 特性 都 是 可 用 的 。 分 配给 程序 的 独立 内 存 区 域 被 称 为 段 ， 而 处 理 器 会 阻止 程序 使 用 自 
身段 范围 之 外 的 内 存 。 

虚拟 8086 模式 ( Virtual-8086 Mode) 保护 模式 下 ， 处 理 器 可 以 在 一 个 安全 环境 中 ， 
直接 执行 实地 址 模式 软件 ， 如 MS-DOS 程序 。 换 句 话 说， 如 果 一 个 程序 崩溃 了 或 是 试图 向 
系统 内 存 区 域 写 数据 ， 都 不 会 影响 到 同一 时 间 内 执行 的 其 他 程序 。 现 代 操 作 系统 可 以 同时 执 
行 多 个 独立 的 虚拟 8086 会 话 。 

实地 址 模式 (Real-Address Mode) 实地 址 模式 实现 的 是 早期 Intel 处 理 器 的 编程 环境 ， 
但 是 增加 了 一 些 其 他 的 特性 ， 如 切换 到 其 他 模式 的 功能 。 当 程序 需要 直接 访问 系统 内 存 和 硬 
件 设备 时 ， 这 种 模式 就 很 有 用 。 

系统 管理 模式 ( System Management Mode) 系统 管理 模式 ( SMM) 向 操作 系统 提供 
了 实现 诸如 电源 管理 和 系统 安全 等 功能 的 机 制 。 这 些 功能 通常 是 由 计算 机 制造 商 实现 的 ， 他 
们 为 了 一 个 特定 的 系统 设置 而 定制 处 理 器 。 


2.2.2 ”基本 执行 环境 


1. 地 址 空间 
在 32 位 保护 模式 下 ， 一 个 任务 或 程序 最 大 可 以 寻 址 4GB 的 线性 地 址 空间 。 从 P6 处 理 
器 开始 ， 一 种 被 称 为 扩展 物理 寻 址 (extended physical addressing) 的 技术 使 得 可 以 被 寻 址 的 
物理 内 存 空间 增加 到 64GB。 与 之 相反 ， 实 地 址 模式 程序 只 能 寻 址 1MB 空间 。 如 果 处 理 器 
在 保护 模式 下 运行 多 个 虚拟 8086 程序 ， 则 每 个 程序 只 能 拥有 自己 的 1MB 内 存 空间 。 
32 位 通用 寄存 器 





16 位 段 寄 存 器 
E 
F 
G. 


EFLAGS CS 


图 2-3 基本 程序 执行 寄存 器 
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2. 基本 程序 执行 寄存 器 

寄存 器 是 直接 位 于 CPU 内 的 高 速 存 储 位 置 ， 其 设计 访问 速度 远 高 于 传统 存储 器 。 例 如 ， 
当 一 个 循环 处 理 为 了 速度 进行 优化 时 ， 其 循环 计数 会 保留 在 寄存 器 中 而 不 是 变量 中 。 图 2-3 
展示 的 是 基本 程序 执行 寄存 器 (basic program execution registers ) 。8 个 通用 寄存 器 ，6 个 段 
寄存 器 ， 一 个 处 理 器 状态 标志 寄存 器 ( EFLAGS)， 和 一 
个 指令 指针 寄存 器 (EIP)。 

通用 寄存 器 ”通用 寄存 器 主要 用 于 算术 运算 和 数据 
传输 。 如 图 2-4 所 示 ，EAX 寄存 器 的 低 16 位 在 使 用 时 可 
以 用 AX 表示 。 

一 些 寄存 器 的 组 成 部 分 可 以 处 理 8 位 的 值 。 例 如 ，AX 
寄存 器 的 高 8 位 被 称 为 AH， 而 低 8 位 被 称 为 AL。 同 样 的 ”一 一 
重 春 关系 也 存在 于 EAX、EBX、ECX 和 EDX 寄存 器 中 : 图 2-4 通用 寄存 器 
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其 他 通用 寄存 器 只 能 用 32 位 或 16 位 名 称 来 访问 ， 如 下 表 所 示 : 
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特殊 用 法 ” 某 些 通用 寄存 器 有 特殊 用 法 : 
e 乘除 指令 默认 使 用 EAX。 它 常常 被 称 为 扩展 累加 器 (extended accumulator) 寄存 器 。 
e CPU 默认 使 用 ECX 为 循环 计数 器 。 
e ESP 用 于 寻 址 堆栈 (一 种 系统 内 存 结构 ) 数据 。 它 极 少 用 于 一 般 算 术 运 算 和 数据 传 
输 ， 通 常 被 称 为 扩展 堆栈 指针 (extended stack pointer) 寄存 器 。 
e ESI 和 EDI 用 于 高 速 存 储 器 传输 指令 ， 有 时 也 被 称 为 扩展 源 变 址 (extended source 
index) 寄存 器 和 扩展 目的 变 址 (extended destination index ) 寄存 器 。 
e 高 级 语言 通过 EBP 来 引用 堆栈 中 的 函数 参数 和 局 部 变量 。 除 了 高 级 编程 ， 它 不 用 于 一 
般 算 术 运 算 和 数据 传输 。 它 常常 被 称 为 扩展 帧 指针 (extended frame pointer) 寄存 器 。 
段 寄 存 器 ”实地 址 模式 中 ，16 位 段 寄 存 器 表示 的 是 预先 分 配 的 内 存 区 域 的 基 址 ， 这 个 
内 存 区 域 称 为 段 。 保 护 模 式 中 ， 段 寄存 器 中 存放 的 是 段 描述 符 表 指针 。 一 些 段 中 存放 程序 指 
令 (代码 )， 其 他 段 存 放 变量 (数据 )， 还 有 一 个 堆栈 段 存 放 的 是 局 部 函数 变量 和 函数 参数 。 
指令 指针 指令 指针 ( EIP) 寄存 器 中 包含 下 一 条 将 要 执行 指令 的 地 址 。 某 些 机 器 指令 
能 控制 EIP， 使 得 程序 分 支 转 向 到 一 个 新 位 置 。 
EFLAGS 寄存 器 EFLAGS (或 Flags) 寄存 器 包含 了 独立 的 二 进 制 位 ， 用 于 控制 CPU 
的 操作 ， 或 是 反映 一 些 CPU 操作 的 结果 。 有 些 指 令 可 以 测试 和 控制 这 些 单独 的 处 理 器 标 
志 位 。 


设置 标志 位 时 ， 该 标识 位 =1; 清除 (或 重 置 ) 标识 位 时 ， 该 标志 位 =0。 
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控制 标志 位 ”控制 标志 位 控制 CPU 的 操作 。 例 如 ， 它 们 能 使 得 CPU 每 执行 一 条 指令 后 
进入 中 断 ; 在 侦 测 到 算术 运算 溢出 时 中 断 执行 ; 进入 虚拟 8086 模式 ， 以 及 进入 保护 模式 。 

程序 能 够 通过 设置 EFLAGS 寄存 器 中 的 单独 位 来 控制 CPU 的 操作 ， 比 如 ， 方 向 标志 位 
和 中 断 标志 位 。 

状态 标志 位 ”状态 标志 位 反映 了 CPU 执行 的 算术 和 逻辑 操作 的 结果 。 其 中 包括 : 溢出 
位 、 符 号 位 、 零 标志 位 、 辅 助 进位 标志 位 、 奇 偶 校 验 位 和 进位 标志 位 。 下 述说 明 中 ， 标 志 位 
的 缩写 紧 跟 在 标志 位 名 称 之 后 : 

@ 进位 标志 位 (CF)， 与 目标 位 置 相 比 ， 无 符号 算术 运算 结果 太 大 时 ， 设 置 该 标志 位 。 

e 溢出 标志 位 (OF)， 与 目标 位 置 相 比 ， 有 符号 算术 运算 结果 太 大 或 太 小 时 ， 设 置 该 标 
志 位 。 

e 符号 标志 位 (SF )， 算 术 或 逻辑 操作 产生 负 结 果 时 ， 设 置 该 标志 位 。 

e 零 标志 位 (ZF)， 算 术 或 逻辑 操作 产生 的 结果 为 零 时 ， 设 置 该 标志 位 。 

e 辅助 进位 标志 位 (AC)， 算 术 操作 在 8 位 操作 数 中 产生 了 位 3 向 位 4 的 进位 时 ， 设 置 
该 标志 位 。 

e 奇偶 校 验 标志 位 (PF)， 结 果 的 最 低 有 效 字 节 包含 偶数 个 1 时 ， 设 置 该 标志 位 ， 否 则 ， 
清除 该 标志 位 。 一 般 情况 下 ， 如 果 数 据 有 可 能 被 修改 或 损坏 时 ,该 标志 位 用 于 进行 
错误 检测 。 

3. MMX 寄存 器 

在 实现 高 级 多 媒体 和 通信 应 用 时 ，MMX 技术 提高 了 Intel 处 理 器 的 性 能 。8 个 64 位 
MMX 寄存 器 支持 称 为 SIMD ( 单 指 令 ， 多 数据 ，Single-Instruction ，Mnultiple-Data) 的 特殊 
指令 。 顾 名 思 义 ，MMX 指令 对 MMX 寄存 器 中 的 数据 值 进行 并 行 操作 。 虽 然 ， 它 们 看 上 去 
是 独立 的 寄存 器 ， 但 是 MMX 寄存 器 名 实际 上 是 浮 点 单元 中 使 用 的 同样 寄存 器 的 别名 。 

4. XMM 寄存 器 

x86 结构 还 包括 了 8 个 128 位 XMM 寄存 器 ， 它 们 被 用 于 SIMD 流 扩展 指令 集 。 

浮 点 单元 浮 点 单元 (FPU，floating-point unit) 执行 高 速 浮 点 算术 运算 。 之 前 为 了 这 个 
目的 ， 需 要 一 个 独立 的 协 处 理 器 芯片 。 从 Intel486 处 理 器 开始 ，FPU 已 经 集成 到 主 处 理 器 芯 
片上 。FPU 中 有 8 个 浮 点 数据 寄存 器 ， 分 别 命名 为 ST(0),ST(1),ST(2),ST(3),ST(4)， 
ST(5)，ST (6) 和 ST(7)。 其 他 控制 寄存 器 和 指针 寄存 器 如 图 2-5 所 示 。 


80 位 数据 寄存 器 


48 位 指针 寄存 器 
FPU 数据 指针 | 


16 位 控制 寄存 器 


控制 寄存 器 








操作 码 寄存 器 。 | 


图 2-5 浮 点 单元 寄存 器 
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2.2.3 ” x86 内存 管 理 


x86 处 理 器 按照 2.2.1 节 中 讨论 的 基本 操作 模式 来 管理 内 存 。 保 护 模式 是 最 可 靠 、 最 强 
大 的 ， 但 是 它 对 应 用 程序 直接 访问 系统 硬件 有 着 严格 的 限制 - 

在 实地 址 模式 中 ， 只 能 寻 址 1MB 内 存 ， 地 址 从 00000H 到 FFFFFH。 处 理 器 一 次 只 能 
运行 一 个 程序 ,但 是 可 以 暂时 中 断 程 序 来 处 理 来 自 外 围 设备 的 请 求 ( 称 为 中 断 〈interrupt) )。 
应 用 程序 被 允许 访问 内 存 的 任何 位 置 ， 包 括 那 些 直 接 与 系统 硬件 相关 的 地 址 。MS-DOS 操作 
系统 在 实地 址 模式 下 运行 ，Windows 95 和 98 能 够 引导 进入 这 种 模式 。 

在 保护 模式 中 ， 处 理 器 可 以 同时 运行 多 个 程序 ， 它 为 每 个 进程 (运行 中 的 程序 ) 分 配 总 
共 4GB 的 内 存 。 每 个 程序 都 分 配 有 自己 的 保留 内 存 区 域 , 程序 之 间 禁 止 意 外 访问 其 他 程序 
的 代码 和 数据 。MS-Windows 和 Linux 运行 在 保护 模式 下 。 

在 虚拟 8086 模式 中 ,计算 机 运行 在 保护 模式 下 ， 通 过 创建 一 个 带 有 1MB 地 址 空间 的 虚 
拟 8086 机 器 来 模拟 运行 于 实地 址 模式 的 80x86 计算 机 。 例 如 ， 在 Windows NT 和 2000 下 ， 
当 打 开 一 个 命令 窗口 时 ， 就 创建 了 一 个 虚拟 8086 机 器 。 同 一 时 间 可 以 运行 多 个 这 样 的 窗口 ， 
并 且 窗 口 之 间 都 是 受到 保护 的 。 在 Windows NT，2000 和 XP 系统 中 ， 某 些 需 要 直接 使 用 计 
算 机 硬件 的 MS-DOS 程序 不 能 运行 在 虚拟 8086 模式 下 。 

实地 址 模式 和 保护 模式 的 更 多 细节 将 在 第 11 章 中 进行 详 述 。 


2.2.4 ”本 节 回 顾 


1. x86 处 理 器 的 3 个 基本 操作 模式 是 什么 ? 
2. 给 出 8 个 32 位 通用 寄存 器 的 名 称 。 

3. 给 出 6 个 段 寄 存 器 的 名 称 。 

4. ECX 寄存 器 的 特殊 用 途 是 什么 ? 


2.3 ”64 位 x86-64 处 理 器 


本 节 重 点 关注 所 有 使 用 x86-64 指令 集 的 64 位 处 理 器 的 基本 架构 细节 。 这 些 处 理 器 包括 
Intel 64 和 AMD64 处 理 器 系列 。 指 令 集 是 已 讨论 的 x86 指令 集 的 64 位 扩展 。 以 下 为 一 些 基 
本 特征 : 

1 ) 向 后 兼容 x86 指令 集 。 

2 ) 地 址 长 度 为 64 位 ， 虚 拟 地 址 空间 为 2” 字 节 。 按 照 当 前 芯片 的 实现 情况 ， 只 能 使 用 


地 址 的 低 48 位 。 


3 ) 可 以 使 用 64 位 通用 寄存 器 ， 人 允许 指令 具有 64 位 整数 操作 数 。 

4) 比 x86 多 了 8 个 通用 寄存 器 。 

5 ) 物理 地 址 为 48 位 ， 支 持 高 达 256TB 的 RAM。 

另 一 方面 ， 当 处 理 器 运行 于 本 机 64 位 模式 时 ， 是 不 支持 16 位 实 模 式 或 虚拟 8086 模式 
的 。( 在 传统 模式 〈1legacy mode) 下 ,还 是 支持 16 位 编程 ， 但 是 在 Microsoft Windows 64 位 
版 本 中 不 可 用 。) 


注意 尽管 x86-64 指 的 是 指令 集 ， 但 是 也 可 以 将 其 看 作 是 处 理 器 类 型 。 学 习 汇 编 语 





言 时 ， 没 有 必要 考虑 支持 x86-64 的 处 理 器 之 间 的 硬件 实现 差异 。 
第 一 个 使 用 x86-64 的 Intel 处 理 器 是 Xeon， 之 后 还 有 许多 其 他 的 处 理 器 ， 包 括 Core i5 
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和 Core i7。AMD 处 理 器 中 使 用 x86-64 的 例子 有 Opteron 和 Athlon 64。 
另 一 个 为 人 所 知 的 64 位 Intel 架构 是 IA-64， 后 来 被 称 为 Itanium。IA-64 指令 集 与 x86 
和 x86-64 完全 不 同 ，Itanium 处 理 器 通常 用 于 高 性 能 数据 库 和 网 络 服务 器 。 


2.3.1 64 位 操作 模式 


Intel 64 架构 引入 了 一 个 新 模式 ， 称 为 IJA-32e。 从 技术 上 看 ， 这 个 模式 包含 两 个 子 模式 : 
兼容 模式 (compatibility mode) 和 64 位 模式 ( 64-bit mode)。 不 过 它们 常常 被 看 做 是 模式 而 
不 是 子 模式 ， 因 此 ， 先 来 了 解 这 两 个 模式 . 

1. 兼容 模式 

在 兼容 模式 下 ， 现 有 的 16 位 与 32 位 应 用 程序 通常 不 用 进行 重新 编译 就 可 以 运行 。 但 
是 ，16 位 Windows ( Win16 ) 和 DOS 应 用 程序 不 能 运行 在 64 位 Microsoft Windows 下 。 与 
早期 Windows 版 本 不 同 ，64 位 Windows 没有 虚拟 DOS 机 器 子 系统 来 利用 处 理 器 的 功能 切 
换 到 虚拟 8086 模式 。 

2. 64 位 模式 

在 64 位 模式 下 ， 处 理 器 执行 的 是 使 用 64 位 线性 地 址 空间 的 应 用 程序 。 这 是 64 位 
Microsoft Windows 的 原生 模式 ， 该 模式 能 使 用 64 位 指令 操作 数 。 


2.3.2 ”基本 64 位 执行 环境 


64 位 模式 下 ， 虽 然 处理 器 现在 只 能 支持 48 位 的 地 址 ,但 是 理论 上 ， 地 址 最 大 为 64 位 。 
从 寄存 器 来 看 ，64 位 模式 与 32 位 最 主要 的 区 别 如 下 所 示 : 

e 16 个 64 位 通用 寄存 器 ( 32 位 模式 只 有 8 个 通用 寄存 器 ) 

e 8 个 80 位 浮 点 寄存 器 

e 1 个 64 位 状态 标志 寄存 器 RFLAGS (只 使 用 低 32 位) 

e 1 个 64 位 指令 指针 寄存 器 RIP 

回顾 前 文 ，32 位 标志 寄存 器 和 指令 指针 寄存 器 分 别称 为 EFLAGS 和 EIP。 此 外 ,还 有 
一 些 在 讨论 x86 处 理 器 时 提 过 的 ， 用 于 多 媒体 处 理 的 特殊 寄存 器 : 

e 8 个 64 位 MMX 寄存 器 

e 16 个 128 位 XMM 寄存 器 (32 位 模式 只 有 8 个 XMM 寄存 器 ) 

通用 寄存 器 

在 描述 32 位 处 理 器 时 介绍 过 通用 寄存 器 ， 它 们 是 算术 运算 、 数 据 传输 和 循环 遍历 数据 指 
令 的 基本 操作 数 。 通 用 寄存 器 可 以 访问 8 位 、16 位 、32 位 或 64 位 操作 数 ( 需 使 用 特殊 前 缀 )。 

64 位 模式 下 ， 操 作 数 的 默认 大 小 是 32 位 ， 并 且 有 8 个 通用 寄存 器 。 但 是 ， 给 每 条 指令 
加 上 REX (寄存 器 扩展 ) 前 缀 后 ， 操 作 数 可 以 达到 64 位 ， 可 用 通用 寄存 器 的 数量 也 增加 到 
16 个 : 32 位 模式 下 的 寄存 器 ， 再 加 上 8 个 有 标号 的 寄存 器 ，R8 到 R15。 表 2-1 给 出 了 REX 
前 缀 下 可 用 的 寄存 器 。 

表 2-1 使 用 REX 前 缀 后 ，64 位 模式 的 操作 数 大 小 

可 用 寄存 器 


AL、BL、CL、DL、DIL、SIL、BPL、SPL、R8L、R9L、R1I0L、RIIL、Rl2L、R13L、R14 蕊 、 
R15L 


AX、BX、CX、DX、DI、SI、BP、SP、R8W 、R9W 、R10W 、R1IIW、R12W、R1I3W、R14W、 
RISW 






操作 数 大 小 
8 位 
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操作 数 大 小 
32 位 






EAX. EBX、 ECX、 EDX、 EDI, ESI、 EBP、 ESP、 R8D, R9D RI0D, RIlID R12D、 R13D、 
RI4D、RI5D 


RAX. RBX、 RCX、 RDX. RDI. RSI. RBP、 RSP、 R8、 R9、 RI0、 RIl、 R12、 R13、R14、 
R15 





还 有 一 些 需 要 记 住 的 细节 : 

e 64 位 模式 下 ， 单 条 指令 不 能 同时 访问 寄存 器 高 字 节 ,如 AH、BH、CH 和 DH， 以 及 
新 字 节 寄存 器 的 低 字 节 (如 DIL )。 

e 64 位 模式 下 ，32 位 EFLAGS 寄存 器 由 64 位 RFLAGS 寄存 器 取代 。 这 两 个 寄存 器 共 
享 低 32 位 ， 而 RFLAGS 的 高 32 位 是 不 使 用 的 。 

e 32 位 模式 和 64 位 模式 具有 相同 的 状态 标志 。 


2.4 典型 x86 计算 机 组 件 


本 节 首 先 通过 检查 典型 主板 配置 以 及 围绕 CPU 的 芯片 组 来 了 解 x86 如 何 与 其 他 组 件 的 
集成 。 然 后 讨论 内 存 、IO 端口 和 通用 设备 接口 。 最 后 说 明 汇 编 语言 程序 怎样 利用 系统 硬件 、 
固件 ， 并 调用 操作 系统 函数 来 实现 不 同 访问 层次 的 IO 操作 。 


2.4.1 主板 


主板 是 微型 计算 机 的 心 胜 ， 它 是 一 个 平面 电路 板 ， 其 上 集成 了 CPU、 支 持 处 理 器 (芯片 
组 (chipset))、 主 存 、 输 入 输出 接口 、 电 源 接口 和 扩展 插 槽 。 各 种 组 件 通过 总 线 即 一 组 直接 
蚀刻 在 主板 上 的 导线 ， 进 行 互 连 。 目 前 PC 市 场 上 有 几 十 种 主板 ， 它 们 在 扩展 功能 、 集 成 部 
件 和 速度 方面 存在 着 差异 。 但 是 ， 下 述 组 件 一 般 都 会 出 现在 主板 上 : 

e CPU 插座 。 根 据 其 支持 的 处 理 器 类 型 ， 插 座 具 有 不 同 的 形状 和 尺寸 。 

e 存储 器 插 模 (SIMM 或 DIMM)， 用 于 直接 插入 小 型 内 存 条 。 

e@ BIOS (基本 输入 输出 系统 ，basic input-output system) 计算 机 芯片 ， 保 存 系统 软件 。 

e CMOS RAM， 用 一 个 小 型 纽扣 电池 为 其 持续 供电 。 

e 大 容量 插 槽 设备 接口 ， 如 硬盘 和 CD-ROMS。 

e 外 部 设备 的 USB 接口。 

。 键盘 和 鼠标 接口 。 

e PCI 总 线 接口 ， 用 于 声卡 、 显 卡 、 数 据 采 集 卡 和 其 他 输入 输出 设备 。 

以 下 是 可 选 组 件 : 

e 集成 声音 处 理 器 。 

e 并 行 和 串 行 设备 接口 。 

。 集成 网 卡 。 

e 用 于 高 速 显 卡 的 AGP 总 线 接口 。 

典型 系统 中 还 有 一 些 重 要 的 支持 处 理 器 : 

@ 浮 点 单元 (FPU)， 处 理 浮 点 数 和 扩展 整数 运算 。 

e 8284/82C84 时 钟 发 生 器 ， 简 称 时 钟 ， 按 照 恒定 速率 振荡 。 时 钟 发 生 器 同步 CPU 和 计 

算 机 的 其 他 部 分 。 
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@ 8259A 可 编程 中 断 控制 器 (PIC，Programmable Interrupt Controller)， 处 理 来 自 硬件 
设备 的 外 部 中 断 请 求 ， 包 括 键 盘 、 系 统 时 钟 和 磁盘 驱动 器 。 这 些 设 备 能 中 断 CPU， 
并 使 其 立即 响应 它们 的 请 求 。 
@ 8253 可 编程 间隔 定时 器 /计数 器 (Programmable Interval Timer/Counter)， 每 秒 中 断 
系统 18.2 次 ， 更 新 系统 日 期 和 时 钟 ， 并 控制 扬声器 。 它 还 负责 不 断 刷新 内 存 ， 因 为 
RAM 存储 器 芯片 保持 其 内 容 的 时 间 只 有 几 毫 秒 。 
e@ 8255 可 编程 并 行 端口 (Programmable Parallel Port)， 使 用 IEEE 并 行 端口 将 数据 输入 
和 输出 计算 机 。 该 端口 通常 用 于 打印 机 ， 但 是 也 可 以 用 于 其 他 输入 输出 设备 。 
1. PCI 和 PCI Express 总 线 架构 
PCI (外 部 设备 互联 ，Peripheral Component Interconnect) 总 线 为 CPU 和 其 他 系统 设备 
提供 了 连接 桥 ， 这 些 设 备 包括 硬盘 驱动 器 、 内 存 、 显 卡 、 声 卡 和 网 卡 。 最 近 ，PCI Express 
总 线 在 设备 、 内 存 和 处 理 器 之 间 提 供 了 双向 串 行 连接 。 如 同 网 络 一 样 ， 它 用 独立 的 “通道 
传送 数据 包 。 该 总 线 得 到 显卡 的 广泛 支持 ， 能 以 较 高 速度 传输 数据 。 
2. 主板 芯片 组 
主板 芯片 组 (motherboard chipset) 是 一 组 处 理 器 芯片 的 集合 ， 这 些 芯 片 被 设计 为 在 特 
定 类 型 主板 上 一 起 工作 。 各 种 芯片 组 具有 增强 处 理 能 力 、 多 媒体 功能 或 减少 功 耗 等 特性 。 以 
Intel P965 Express 芯片 组 为 例 ， 该 芯片 组 与 Intel Core2 Duo 或 Pentium D 处 理 器 一 起 ， 用 于 
桌面 系统 。Intel P965 具有 下 述 特性 : 
@ Jntel 高 速 内 存 访 问 (Fast Memory Access) 使 用 了 最 新 内 存 控制 中 心 (MCH)。 它 可 
以 800MHz 时 钟 速度 来 访问 双 通 道 DDR2 存储 器 。 
e。 1/0 控制 中 心 (Intel ICH8/R/DH) 使 用 Intel 答 阵 存储 技术 ( MST) 来 支持 多 个 串 行 
ATA 设备 (磁盘 驱动 器 )。 
@ 支持 多 个 USB 端口 ， 多 个 PCI Express 插 槽 ， 联 网 和 Intel 静音 系统 技术 。 
。 高 清晰 音频 芯片 提供 了 数字 声音 功能 。 
如 图 2-6 所 示 ， 主 板 厂 商 以 特定 芯片 为 中 心 来 制造 产品 。 例 如 ，Asus 公司 使 用 P965 芯 
片 组 的 P5B-E P965 主板 。 






cachx 1 h ee 
CP Tntel* Matrix 8 
Intel* GbE LAN Technology 


图 2-6 ”Intel 965 Express 芯片 组 框图 
来 源 : Intel P965 Express 芯片 组 (产品 简介 )，Intel 公司 版 权 所 有 ， 已 获 使 用 权 。 
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2.4.2 内存 


基于 Intel 的 系统 使 用 的 是 几 种 基础 类 型 内 存 : 只 读 存 储 器 (ROM)、 可 擦 除 可 编程 只 读 
存储 器 ( EPROM)、 动 态 随 机 访问 存储 器 ( DRAM)、 静 态 RAM ( SRAM)、 图 像 随机 存储 器 
(VRAM)， 和 互补 金属 氧化 物 半 导体 (CMOS) RAM: 

e ROM 永久 烧 录 在 芯片 上 ， 并 且 不 能 擦 除 。 

e EPROM 能 用 紫外 线 缓慢 擦 除 ， 并 是 重新 编程 。 

“。 DRAM， 即 通常 的 内 存 ， 在 程序 运行 时 保存 程序 和 数据 的 部 件 。 该 部 件 价格 便宜 ， 
但 是 每 毫秒 需要 进行 刷新 ， 以 避免 丢失 其 内 容 。 有 些 系统 使 用 的 是 ECC (错误 检查 
和 纠正 ) 存储 器 。 

SRAM 主要 用 于 价格 高 、 速 度 快 的 cache 存储 器 。 它 不 需要 刷新 ，CPU 的 cache 存储 
器 就 是 由 SRAM 构成 的 。 
e VRAM 保存 视频 数据 。VRAM 是 双 端 口 的 ， 它 允许 一 个 端口 持续 刷新 显示 器 ， 同 时 

另 一 个 端口 将 数据 写 到 显示 器 。 

e CMOS RAM 在 系统 主板 上 ， 保 存 系统 设置 信息 。 它 由 电池 供电 ， 因 此 当 计算 机 电源 
关闭 后 ，CMOS RAM 中 的 内 容 仍 能 保留 。 


2.4.3 ”本 节 回 顾 

1. 描述 SRAM 及 其 最 常见 的 用 途 。 

2. 描述 VRAM ，。 

3. 列 出 Intel P965 Express 芯片 组 至 少 两 个 特性 。 
4. 写 出 本 章 描述 的 4 类 RAM。 

5. 8259A PIC 控制 器 的 用 途 是 什么 ? 


2.5 输入 输出 系统 


提示 “由 于 计算 机 游戏 与 内 存 和 LI/O 有 着 非常 密切 的 关系 ， 因 此 ， 它 们 推动 计算 机 
达到 其 最 大 性 能 。 善 于 游戏 编程 的 程序 员 通 常 很 了 解 视 频 和 音频 硬件 ， 并 会 优化 代码 的 





硬件 特性 。 


2.5.1 1/O 访问 层次 


应 用 程序 通常 从 键盘 和 磁盘 文件 读 取 输入 ， 而 将 输出 写 到 显示 器 和 文件 中 。 完 成 1/O 不 
需要 直接 访问 硬件 一 一 相反 ， 可 以 调用 操作 系统 的 函数 。 与 第 1 章 中 描述 的 虚拟 机 相似 ，IO 
也 有 不 同 的 访问 层次 ， 主 要 有 以 下 三 个 : 

e 高 级 语言 函数 : 高 级 编程 语言 ， 如 C++ 或 Java， 包 含 了 执行 输入 输出 的 函数 。 由 于 

这 些 函 数 要 在 各 种 不 同 的 计算 机 系统 中 工作 ， 并 不 依赖 于 任何 一 个 操作 系统 ， 因 此 ， 
这 些 函数 具有 可 移植 性 。 

e 操作 系统 : 程序 员 能 够 从 被 称 为 API (应 用 程序 编程 接口 ，Application Programming 
Interface) 的 库 中 调用 操作 系统 函数 。 操 作 系 统 提供 高 级 操作 ， 比 如 ， 向 文件 写 人 字 
符 串 ， 从 键盘 读 取 字符 串 ， 和 分 配 内 存 块 。 

e BIOS : 基本 输入 输出 系统 是 一 组 能 够 直接 与 硬件 设备 通信 的 低级 子 程序 集合 。BIOS 
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由 计算 机 制造 商 安装 并 定制 ， 以 适应 机 器 硬件 。 操 作 系 统 通常 与 BIOS 通信 。 

设备 驱动 程序 设备 驱动 程序 允许 操作 系统 与 硬件 设备 和 系统 BIOS 直接 通信 。 例 如 ， 
设备 驱动 程序 可 能 接收 来 自 OS 的 请 求 来 读 取 一 些 数据 ， 而 满足 该 请 求 的 方法 是 ， 通 过 执行 
设备 固件 中 的 代码 ， 用 设备 特有 的 方式 来 读 取 数据 。 设 备 驱 动 程序 有 两 种 安装 方法 : (1 ) 在 
特定 硬件 设备 连接 到 系统 之 前 ,或 者 (2 ) 设备 已 连接 并 且 识 别 之 后 。 对 于 后 一 种 方法 ，OS 
识别 设备 名 称 和 签名 ， 然 后 在 计算 机 上 定位 并 安装 设备 驱动 软件 。 

现在 ， 通 过 展示 应 用 程序 在 屏幕 上 显示 字符 串 的 过 程 , 来 了 解 IO 层次 结构 (图 2-7 )。 
该 过 程 包含 以 下 步 又: 

1) 应 用 程序 调用 HLL 库 函 数 ， 将 字符 串 写 人 标准 
输出 。 

2 ) 库 函 数 (第 3 层 ) 调用 操作 系统 函数 ， 传 递 一 个 字 
符 串 指针 。 

3 ) 操作 系统 函数 (第 2 层 ) 用 循环 的 方法 调用 BIOS 
子 程序 ， 向 其 传递 每 个 字符 的 ASCII 码 和 颜色 。 操 作 系 统 
调用 男 一 个 BIOS 子 程序 ， 将 光标 移动 到 屏幕 的 下 一 个 位 
是 上 5 

4) BIOS 子 程序 (第 1 层 ) 接收 一 个 字符 ， 将 其 映射 
到 一 个 特定 的 系统 字体 ， 并 把 该 字符 发 送 到 与 视频 控制 卡 
相连 的 硬件 端口 。 

5 ) 视频 控制 卡 (第 0 层 ) 为 视频 显示 产生 定时 硬件 信 
号 ,来 控制 光栅 扫描 并 显示 像素 。 

多 层次 编程 ”汇编 语言 程序 在 输入 输出 编程 领域 有 着 
强大 的 能 力 和 灵活 性 。 它 们 可 以 从 以 下 访问 层次 进行 选择 


第 3 层 
第 2 层 


第 1 层 





第 0 层 


(图 2-8 ): 图 2-8 汇编 语言 访问 层次 
。 第 3 层 ; 调用 库 函数 来 执行 通用 文本 1/O 和 基于 文件 的 MO。 例 如， 本 书 也 提供 了 一 
个 这 样 的 库 。 


e 第 2 层 : 调用 操作 系统 函数 来 执行 通用 文本 WO 和 基于 文件 的 MO。 如 果 OS 使 用 了 
图 形 用 户 界 面 ， 它 就 能 用 与 设备 无 关 的 方式 来 显示 图 形 。 

e 第 1 层 : 调用 BlOS 函数 来 控制 设备 具体 特性 ， 如 颜色 、 图 形 、 声 音 、 键 盘 输 入 和 底 
层 磁 盘 UO。 

e 第 0 层 : 从 硬件 端口 发 送 和 接收 数据 ， 对 特定 设备 拥有 绝对 控制 权 。 这 个 方式 没有 广 
泛 用 于 各 种 硬件 设备 ， 因 此 不 具 可 移植 性 。 不 同 设备 通常 使 用 不 同 硬件 端口 ， 因 此 ， 
程序 代码 必须 根据 每 个 设备 的 特定 类 型 来 进行 定制 。 

如 何 进行 权衡 ? 控制 与 可 移植 性 是 最 重要 的 。 第 2 层 (OS) 工作 在 任何 一 个 运行 同样 操 
作 系 统 的 计算 机 上 - 如 果 IO 设备 缺少 某 些 功 能 ， 那 么 OS 将 尽 可 能 接近 预期 结果 ,第 2 层 
速度 并 不 特别 快 ， 因 为 每 个 LO 调用 在 执行 前 ， 都 必须 经 过 好 几 个 层次 。 

第 1 层 (BIOS) 在 具有 标准 BIOS 的 所 有 系统 上 工作 ,但 是 在 这 些 系统 上 不 会 产生 同样 
的 结果 。 例 如 ， 两 台 计算 机 可 能 会 有 不 同 分 辩 率 的 视频 显示 功能 。 在 第 1 层 上 的 程序 员 需 要 
编写 代码 来 检测 用 户 的 硬件 设置 ， 并 调整 输出 格式 来 与 之 匹配 。 第 1 层 的 速度 比 第 2 层 快 ， 
因为 它 与 硬件 之 间 只 隔 了 一 个 层次 。 
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第 0 层 ( 硬 件 ) 与 通用 设备 一 起 工作 ， 如 串 行 端口 ; 或 是 与 由 知名 厂商 生产 的 特殊 IO 
设备 一 起 工作 。 这 个 层次 上 的 程序 必须 扩展 它们 的 编码 逻辑 来 处 理 IO 设备 的 变化 。 实 模式 
的 游戏 程序 就 是 最 好 的 例子 ， 因 为 它们 常常 需要 取得 计算 机 的 控制 权 。 第 0 层 的 程序 执行 速 
度 与 硬件 一 样 快 。 

举 个 例子 ,假设 要 用 音频 控制 设备 来 播放 一 个 WAV 文件 。 在 OS 层 上 ， 不 需要 了 解 已 
安装 设备 的 类 型 ， 也 不 用 关心 设备 卡 的 非 标准 特性 。 在 BIOS 层 上 ， 要 查询 声卡 (通过 其 已 
安装 的 设备 驱动 软件 )， 找 出 它 是 否 属 于 某 一 类 具有 已 知 功能 的 声卡 。 在 硬件 层 上 ， 需 要 对 
特定 模式 声卡 的 程序 进行 微调 ， 以 利用 每 个 声卡 的 特性 。 

通用 操作 系统 极 少 允许 应 用 程序 直接 访问 系统 硬件 ， 因 为 这 样 做 会 使 得 它 几 乎 无 法 同时 
运行 多 个 程序 。 相 反 ， 硬 件 只 能 由 设备 驱动 程序 按照 严格 控制 的 方式 进行 访问 。 另 一 方面 ， 
专业 设备 的 小 型 操作 系统 则 常常 直接 与 硬件 相连 。 这 样 做 是 为 了 减少 操作 系统 代码 占用 的 内 
存 空间 ， 并 且 这 些 操作 系统 几乎 总 是 一 次 只 运行 单个 程序 。Microsoft 最 后 一 个 允许 程序 直 
接 访 问 硬件 的 操作 系统 是 MS-DOS， 它 一 次 只 能 运行 一 个 程序 。 


2.5.2 ”本 节 回 顾 


1. 计算 机 系统 中 有 4 个 输入 输出 层次 ， 哪 一 个 最 具有 通用 性 和 可 移植 性 ? 

2. 区 分 BIOS 层 输入 输出 的 特征 是 什么 ? 

3. 考虑 到 BIOS 中 已 经 有 了 与 计算 机 硬件 通信 的 代码 ， 为 什么 设备 驱动 程序 是 必 
需 的 ? 

4. 在 显示 字符 串 的 例子 中 ， 操 作 系 统 与 视频 控制 卡 之 间 存 在 的 是 哪个 IO 层次 ? 

5. 运行 MS-Windows 和 运行 Linux 的 计算 机 的 BIOS 可 能 存在 不 同 吗 ? 


2.6 ”本 章 小 结 


中 央 处 理 单元 (CPU) 处 理 算术 和 逻辑 运算 。 它 包含 了 有 限 数 量 的 存储 位 置 ， 即 寄存 器 ， 
一 个 高 频 时 钟 用 于 同步 其 操作 ， 一 个 控制 单元 和 一 个 算术 逻辑 单元 。 内 存 存 储 单元 在 计算 机 
程序 运行 时 ， 保 存 指 令 和 数据 。 总 线 是 一 组 并 行 线路 ， 在 计算 机 不 同 部 件 之 间 传 输 数 据 。 

一 条 机 器 指令 的 执行 可 以 分 为 一 系列 独立 的 操作 ， 称 为 指令 执行 周期 。3 个 主要 操作 分 
别 为 取 值 、 译 码 和 执行 。 指 令 周 期 中 的 每 一 步 都 至 少 要 花费 一 个 系统 时 钟 单位 ， 即 时 钟 周 
期 。 加 载 和 执行 过 程 描述 了 程序 如 何 被 操作 系统 定位 ， 加 载 人 内 存 ， 再 由 操作 系统 执行 。 

x86 处 理 器 系列 有 三 种 基本 操作 模式 : 保护 模式 、 实 地 址 模式 和 系统 管理 模式 。 此 外 ， 
还 有 一 个 虚拟 8086 模式 是 保护 模式 的 一 个 特例 。Intel 64 处 理 器 系列 有 两 种 基本 操作 模式 : 
兼容 模式 和 64 位 模式 。 在 兼容 模式 下 处 理 器 可 以 运行 16 位 和 32 位 应 用 程序 。 

寄存 器 为 CPU 内 的 存储 位 置 进行 命名 ， 其 访问 速度 比 常规 内 存 要 快 很 多 。 以 下 是 对 寄 
存 器 的 简要 说 明 : 

e@ 通用 寄存 器 主要 用 于 算术 运算 、 数 据 传 输 和 逻辑 操作 。 

@ 段 寄存 器 存放 预先 分 配 的 内 存 区 域 的 基 址 ， 这 些 内 存 区 域 就 是 段 。 

@ 指令 指针 寄存 器 存放 的 是 下 一 条 要 执行 指令 的 地 址 。 

@ 标志 寄存 器 包含 的 独立 二 进 制 位 用 于 控制 CPU 的 操作 ,并 反映 ALU 操作 的 结果 。 

x86 有 一 个 浮 点 单元 (FPU) 专门 用 于 高 速 浮 点 指令 的 执行 。 

微型 计算 机 的 心脏 是 它 的 主板 ， 主 板 上 有 CPU 、 支 持 处 理 器 、 主 存 、 输 入 输出 接口 、 
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电源 接口 和 扩展 择 槽 。PCI (外 部 设备 互联 ) 总 线 为 Pentium 处 理 器 提供 了 方便 的 升级 途径 。 
大 多 数 主板 集成 了 若干 微 处 理 器 和 控制 器 ， 称 为 芯片 组 。 芯 片 组 在 很 大 程度 上 决定 了 计算 机 


的 性 能 。 


PC 中 使 用 的 几 种 基本 存储 器 为 : ROM、EPROM 、 动 态 RAM (DRAM)、 静 态 RAM 


(SRAM)、 视 频 RAM (VRAM) 和 CMOS RAM。 


与 虚拟 机 概念 相似 ， 输 入 输出 是 通过 不 同 层次 的 访问 来 实现 的 。 库 函数 在 最 高 层 ， 操 作 
系统 是 次 高 层 。BIOS (基本 输入 输出 系统 ) 是 一 组 函数 ， 能 直接 与 硬件 设备 通信 。 程 序 也 可 [50 


以 直接 访问 输入 输出 设备 。 
2.7 关键 术语 


32-bit mode ( 32 位 模式 ) 

64-bit mode ( 64 位 模式 ) 

address bus (地 址 总 线 ) 

application programming interface(APD (应 用 程 
序 接 口 ) 

arithmetic logic unit(ALU) (算术 逻辑 单元 ) 

auxiliary carry flag (辅助 进位 标志 位 ) 

basic program execution registers (基本 程序 执行 
寄存 器 ) 

BIOS(basic input-out put system) (基本 输入 输出 
系统 ) 

bus (总 线 ) 

cache (高 速 缓存 ) 

carry flag (进位 标志 位 ) 

central processor unit(CPU) (中 央 处 理 单元 ) 

clock (时 钟 ) 

clock cycle (时 钟 周 期 ) 

clock generator (时 钟 发 生 器 ) 

code cache (代码 cache) 

control flags (控制 标志 位 ) 

control unit (控制 单元 ) 

data bus (数据 总 线 ) 

data cache (数据 cache ) 

device drivers (设备 驱动 程序 ) 

direction flag (方向 标志 位 ) 

bynamic RAM (动态 RAM) 

EFLAGS register (EFLAGS 寄存 器 ) 

extended destination index (扩展 目的 变 址 ) 

extended physical addressing (扩展 物理 寻 址 ) 

extended source index (扩展 源 变 址 ) 

extended stack pointer (扩展 堆栈 指针 ) 

fetch-decode-execute( 取 值 - 译 码 -执行 ) 





flags register (标志 寄存 器 ) 

floating-poing unit( 浮 点 单元 ) 

general-purpose registers (通用 寄存 器 ) 

instruction decoder (指令 译 码 器 ) 

instruction excution cycle (指令 执行 周期 ) 

instruction queue (指令 队列 ) 

instruction pointer (指令 指针 ) 

interrupt flag (中 断 标 志 位 ) 

Level-l cache ( 1 级 cache) 

Level-2 cache (2 级 cache) 

machine cycle (机 器 周期 ) 

memory storage unit (内 存 存储 单元 ) 

MMX registers (MMX 寄存 器 ) 

motherboard (主板 ) 

motherboard chipset (主板 芯片 组 ) 

operating system(OS) (操作 系统 ) 

overflow flag (溢出 标志 位 ) 

parity flag (奇偶 标志 位 ) 

PCI (peripheral component interconnect) (外 部 设 
备 互 联 ) 

PCI express 

process (过 程 ) 

process ID (过 程 ID) 

programmable interrupt controller(PIC) (可 编程 
中 断 控制 器 ) 

programmable interval interval timer/counter ( 可 
编程 间隔 定时 器 / 计数 器 ) 

programmable parallel port (可 编程 并 行 端口 ) 

protected mode (保护 模式 ) 

random access memory (RAM) (随机 访问 存储 器 ) 

read-only memory (ROM)( 只 读 存储 器 ) 

real-address mode (实地 址 模式 ) 
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registers (寄存 器 ) system management mode(SMM) (系统 管理 模式 ) 


segment registers ( 段 寄 存 器 ) Task Manager (任务 管理 器 ) 
sign flag (符号 标志 位 ) virtual-8086 mode (虚拟 8086 模式 ) 
single-instruction, multiple-data(SIMD) ( 单 指令 wait states (等 待 状态 ) 

多 数据 ) XMM registers (XMM 寄存 器 ) 
static RSM (静态 RAM ) zero flag ( 零 标志 位 ) 


L51 status flags (状态 标志 位 ) 


2.8 复习 题 


1. 32 位 模式 下 ， 除 了 堆栈 指针 (ESP) 寄存器， 还 有 哪些 寄存 器 指向 堆栈 的 参数 ? 
2. 说 出 至 少 4 个 CPU 状态 标志 位 。 
3. 当 无 符号 数 算术 运算 结果 超过 目标 位 置 大 小 时 ， 应 设置 哪个 标志 位 ? 
4. 当 有 符号 数 算术 运算 结果 对 目标 位 置 而 言 太 大 或 太 小 时 ， 应 设置 哪个 标志 位 ? 
5.( 真 / 假 ): 寄存 器 操作 数 为 32 位 ， 使 用 REX 前 级 ， 则 程序 可 以 使 用 R8D 寄存 器 。 
6. 算术 或 逻辑 运算 产生 负数 结果 时 ， 应 设置 哪个 标志 位 ? 
7. CPU 的 哪个 部 件 执行 浮 点 算术 运算 ? 
8. 32 位 处 理 器 中 ， 浮 点 数据 寄存 器 包含 多 少 位 ? 
9.( 真 / 假 ); x86-64 指令 集 向 后 兼容 x86 指令 集 。 
10.( 真 / 假 ): 当前 64 位 芯片 实现 方式 下 ， 所 有 64 位 都 可 以 用 于 寻 址 。 
11.( 真 / 假 ): Itanium 指令 集 与 x86 完全 不 同 。 
12.( 真 / 假 ): 静态 RAM 一 般 比 动态 RAM 便宜 。 
13. ( 真 / 假 ): 加 上 REX 前缀 就 可 以 使 用 64 位 RDI 寄存 器 。 
14.( 真 / 假 ): 在 原生 64 位 模式 下 ， 可 以 使 用 16 位 实 模式 ， 但 是 不 能 使 用 虚拟 8086 模式 。 
15.( 真 / 假 ) x86-64 处 理 器 比 x86 处 理 器 多 4 个 通用 寄存 器 。 
16.( 真 / 假 ): 64 位 的 Microsoft Windows 不 支持 虚拟 8086 模式 。 
17.( 真 / 假 ); DRAM 只 能 用 紫外 线 擦 除 。 
18.( 真 / 假 )，64 位 模式 下 ， 可 以 使 用 的 浮 点 寄存 器 多 达 8 个 。 
19.( 真 / 假 ): 总 线 是 两 端 连接 在 主板 上 的 塑料 电缆 ， 但 没有 直接 位 于 主板 上 。 
20.( 真 / 假 ): CMOS RAM 与 静态 RAM 相同 ， 也 就 是 说 ， 不 需要 额外 的 电源 和 刷新 周期 就 可 以 保持 它 
的 内 容 。 
21.( 真 / 假 ): PCI 接口 用 于 显卡 和 声卡 。 
22.( 真 / 假 ): 8259A 是 一 种 控制 器 ， 用 于 处 理 来 自 硬件 设备 的 外 部 中 断 。 
23.( 真 / 假 ): PCI 是 可 编程 组 件 接口 (programmable component interface) 的 缩写 。 
24.( 真 / 假 ): VRAM 代表 虚拟 随机 访问 存储 器 。 
25, 汇编 语言 程序 在 哪个 (或 哪些 ) 层次 上 可 以 控制 输入 输出 ? 
26. 为 什么 游戏 程序 常常 将 声音 输出 直接 发 送 到 声卡 的 硬件 端口 ? 
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本 章 侧重 于 Microsoft MASM 汇编 程序 的 基本 组 成 部 分 。 读 者 将 会 了 解 到 如 何 定 义 常数 
和 变量 ， 数 字 和 字符 常量 的 标准 格式 ， 以 及 怎样 汇编 并 运行 你 的 第 一 个 程序 。 本 章 特别 强调 
了 Visual Studio 调试 器 ， 它 是 理解 程序 如 何 工 作 的 优秀 工具 。 本 章 最 重要 的 是 ， 一 次 前 进 一 
步 ， 在 进入 到 下 一 步 之 前 ， 要 掌握 每 一 个 细节 。 夯 实 基 础 对 后 续 章 节 来 说 是 非常 有 帮助 的 。 


3.1 基本 语言 元 素 


3.1.1 第 一 个 汇编 语言 程序 


汇编 语言 以 隐 星 难 懂 而 著名 ,但 是 本 书 从 男 一 个 角度 来 看 它 一 一 它 是 一 种 几乎 提供 了 全 
部 信息 的 语言 。 程 序 员 可 以 看 到 正在 发 生 的 所 有 事情 ， 甚 至 包括 CPU 中 的 寄存 器 和 标志 ! 
但 是 ， 在 拥有 这 种 能 力 的 同时 ， 程 序 员 必 须 负 责 处 理 数 据 表 示 的 细节 和 指令 的 格式 。 程 序 员 
工作 在 一 个 具有 大 量 详细 信息 的 层次 。 现 在 以 一 个 简单 的 汇编 语言 程序 为 例 ， 来 了 解 其 工作 
过 程 。 程 序 执行 两 个 数 相 加 ， 并 将 结果 保存 在 寄存 器 中 。 程 序 名 称 为 AddTwo: 


main PROC 
mov eax,5 ; 将 数字 5 送 入 eax 寄存 器 
add eax,6 ;eax 寄存 器 加 6 


INVOKE ExitProcess,0 ;程序 结束 
: main ENDP 


Ls 

2 

3 

4: 

5 

6 

虽然 在 每 行 代码 前 插入 行 号 有 助 于 讨论 ,但 是 在 编写 汇编 程序 时 ， 并 不 需要 实际 键入 行 
号 。 此 外 ， 目 前 还 不 要 试图 输入 并 运行 这 个 程序 ， 因 为 它 还 缺少 一 些 重 要 的 声明 ， 本 章 稍 后 
将 介绍 相关 内 容 。 

现在 按照 一 次 一 行 代码 的 方法 来 仔细 查看 这 段 程序 : 第 1 行 开始 main 程序 ( 主 程序 )， 
即 程序 的 人 口 ; 第 2 行将 数字 5 送信 eax 寄存 器 ; 第 3 行 把 6 加 到 EAX 的 值 上 ， 得 到 新 值 
11 ; 第 5 行 调用 Windows 服务 (也 被 称 为 函数 ) ExitProcess 停止 程序 ， 并 将 控制 权 交 还 给 
操作 系统 ; 第 6 行 是 主 程序 结束 的 标记 。 

读者 可 能 已 经 注意 到 了 程序 中 包含 的 注释 ， 它 总 是 用 分 号 开头 。 程 序 的 顶部 省 略 了 一 些 
声明 ， 稍 后 会 予以 说 明 ， 不 过 从 本 质 上 说 ， 这 是 一 个 可 以 用 的 程序 。 它 不 会 将 全 部 信息 显示 
在 屏幕 上 ， 但 是 借助 工具 程序 调试 器 的 运行 ， 程 序 员 可 以 按 一 次 一 行 代码 的 方式 执行 程序 ， 
并 查看 寄存 器 的 值 。 本 章 的 后 面 将 展示 如 何 实现 这 个 过 程 。 

添加 一 个 变量 

现在 让 这 个 程序 变 得 有 趣 些 ， 将 加 法 运算 的 结果 保存 在 变量 sum 中 。 要 实现 这 一 点 ， 
需要 增加 一 些 标记 ， 或 声明 ， 用 来 标识 程序 的 代码 和 数据 区 : 


1: .data ; 此 为 数据 区 
2: sum DWORD 0 ; 定义 名 为 sum 的 变量 
3 





L55 | 


40 钾 3 茧 


4: .code 7 此 为 代码 区 

5: main PROC 

6: mov eax,5 ; 将 数字 5 送 入 eax 寄存 器 
7: add eax, 6 ; eax 寄存 器 加 6 

8 : mov sum,eax 

9: 

10: INVOKE ExitProcess,0 ;程序 结束 


11: main ENDP 


变量 sum 在 第 2 行进 行 了 声明 ， 其 大 小 为 32 位 ， 使 用 了 关键 字 DWORD。 汇 编 语言 中 
有 很 多 这 样 的 大 小 关键 字 ， 其 作用 或 多 或 少 与 数据 类 型 一 样 。 但 是 与 程序 员 可 能 熟悉 的 类 型 
相 比 它 们 没有 那么 具体 ， 比 如 int、double 、float 等 等 。 这 些 关 键 字 只 限制 大 小 ， 并 不 检查 
变量 中 存放 的 内 容 。 记 住 ， 程 序 员 拥 有 完全 控制 权 。 

顺便 说 一 下 ， 那 些 被 .code 和 .data 伪 指 令 标记 的 代码 和 数据 区 ， 被 称 为 段 。 即 ， 程 序 
有 代码 段 和 数据 段 。 在 本 章 后 面 的 内 容 中 ， 还 要 命名 第 三 种 段 : 堆栈 (stack)。 

接 下 来 ， 将 更 深入 地 研究 汇编 语言 的 细节 ， 展 示 如 何 声明 常量 (又 称 常 数 )、 标 识 符 、 
伪 指 令 和 指令 。 读 者 可 能 需要 反复 阅读 本 章 来 记 住 这 些 内 容 , 但 是 这 个 时 间 绝 对 花 得 值得 。 
另外 , 本章 中 每 次 提 到 汇编 器 使 用 的 语法 规则 时 ， 实 际 是 指 Microsoft MASM 汇编 器 使 用 的 
语法 规则 。 虽 然 其 他 汇编 器 使 用 的 语法 规则 不 同 ， 但 是 ， 本 章 将 忽略 它们 。 每 次 提 到 汇编 器 
时 不 再 重复 印刷 MASM 这 个 词 ， 可 能 至 少 能 节约 下 (世界 上 某 个 地 方 的 ) 一 棵 树 。 


3.1.2 整数 常量 


整数 常量 ( integer literal) (又 称 为 整 型 常量 (integer constant) ) 由 一 个 可 选 前 置 符号 、 
一 个 或 多 个 数字 ， 以 及 一 个 指明 其 基数 的 可 选 基数 字符 构成 : 


[{+ | - )] digits [ radix ] 


本 书 使 用 Microsoft 语法 符号 。 方 括号 内 的 元 素 是 可 选 的 ; 大 括号 内 的 元 素 用 | 符号 





分 隔 ， 且 必须 要 选择 其 中 一 个 元 素 ; 斜体 字 标 识 的 是 有 明确 定义 或 说 明 的 元 素 。 


由 此 ， 比 如 26 就 是 一 个 有 效 的 整数 常量 。 它 没有 基数 ， 所 以 假设 其 是 十 进 制 形 式 。 如 
果 想 要 表示 十 六 进 制 数 26， 就 将 其 写 为 26h。 同 样 ， 数 字 1101 可 以 被 看 做 是 十 进 制 值 ， 除 
非 在 其 末尾 添加 “b”， 使 其 成 为 1101b (二 进 制 )。 下 表 列 出 了 可 能 的 基数 值 : 


十 进 制 (备用 ) 


二 进 制 (备用 ) 





下 面 这 些 整 数 常量 声明 了 各 种 基数 。 每 行 都 有 注释 : 


26 ; 十 进 制 
26Q ; 十 进 制 
11010011b ; 二 进 制 
42qa ; 八进制 
420 ? 八进制 
1Rh ; 十 六 进 制 
0RA3h ; 十 六 进 制 


以 字母 开头 的 十 六 进 制 数 必须 加 个 前 置 0， 以 防 汇编 器 将 其 解释 为 标识 符 。 
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3.1.3” 整 型 常量 表达 式 


整 型 常量 表达 式 〔〈constant integer expression) 是 一 种 算术 表达 式 ， 它 包含 了 整数 常量 和 
算术 运算 符 


算术 运算 符 。 每 个 表达 式 的 计算 结果 必须 是 一 个 整数 ， 并 表 3-1 
可 用 32 位 (从 0 到 FFFFFFFFh) 来 存放 。 表 3-1 列 出 了 
算术 运算 符 ， 并 按照 从 高 (1 ) 到 低 (4) 的 顺序 给 出 了 它 
们 的 优先 级 。 对 整 型 常量 表达 式 而 言 很 重要 的 是 ， 要 意识 
到 它们 只 在 汇编 时 计算 。 从 现在 开始 ， 本 书 将 它们 简称 为 
整数 表达 式 。 

运算 符 优先 级 ( operator precedence) 是 指 ， 当 一 个 
表达 式 包 含 两 个 或 多 个 运算 符 时 ， 这 些 操作 的 执行 顺序 。 下 面 是 一 些 表 达 式 和 它们 的 执行 
顺序 : 


4+5*2 ; 乘法， 加 法 

12 -1 MOD 5 ; 取 模 ， 减 法 

沁 5 证/ 逆 ; 一 元 减法 ， 加 法 

(4 + 2) * 6 7 加 法 ， 乘 法 

下 面 给 出 了 一 些 有 效 表达 式 和 它们 的 值 : 

表达 式 值 

16/5 3 
(3+4)* (6-1) 35 
—3+4*6—1 20 
25 mod 3 1 





3.1.4 实数 常量 


实数 常量 (real number literal)( 又 称 为 浮 点 数 常量 (floating-point literal) ) 用 于 表示 十 进 
制 实 数 和 编码 (十 六 进 制 ) 实数 。 十 进 制 实数 包含 一 个 可 选 符号 ， 其 后 跟随 一 个 整数 ， 一 个 
十 进 制 小 数 点 ,一 个 可 选 的 表示 小 数 部 分 的 整数 ， 和 一 个 可 选 的 指数 : 


[sign] integer. [integer] [exponent] 


符号 和 指数 的 格式 如 下 : 


sign {+7=} 

exponent E[{+,-}]integer 

下 面 是 一 些 有 效 的 十 进 制 实数 : 

证 

-44.2E+05 

26.E5 

至 少 需 要 一 个 数字 和 一 个 十 进 制 小 数 点 。 

编码 实数 ( encoded real) 表示 的 是 十 六 进 制 实数 ， 用 IEEE 浮 点 数 格式 表示 短 实数 ( 参 
见 第 12 章 )。 比 如 ， 十 进 制 数 +1.0 用 二 进 制 表 示 为 : 
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0011 1111 1000 0000 0000 0000 0000 0000 


在 汇编 语言 中 ， 同 样 的 值 可 以 编码 为 短 实数 : 


3F800000r 


实数 常量 暂时 还 不 会 用 到 ， 因 为 大 多 数 x86 指令 集 是 专门 针对 整数 处 理 的 。 不 过 ,第 
12 章 将 会 说 明 怎样 用 实数 ， 又 称 为 浮 点 数 ， 进 行 算术 运算 。 这 是 非常 有 趣 ， 又 非常 有 技术 
性 的 。 


3.1.5 ”字符 常量 


字符 常量 ( character literal) 是 指 ， 用 单 引号 或 双 引 号 包含 的 一 个 字符 。 汇 编 器 在 内 存 
中 保存 的 是 该 字符 二 进 制 ASCII 码 的 数值 。 例 如 : 

回想 第 1 章 表明 字符 常量 在 内 部 保存 为 整数 ， 使 用 的 是 ASCII 编码 序列 。 因 此 ， 当 编 
写字 符 常 量 “A” 时 ， 它 在 内 存 中 存放 的 形式 为 数字 65 (或 41h)。 本 书 封底 内 页 有 完整 的 
ASCII 码 表 ， 读 者 需要 经 常 查阅 此 表 。 


3.1.6 ”字符 串 常 量 
字符 串 常量 (string literal) 是 用 单 引 号 或 双 引 号 包含 的 一 个 字符 〈 含 空格 符 ) 序列 : 


,ABC， 
x! 

"Good night, Gracie" 
'4096' 


嵌 套 引号 也 是 被 允许 的 ,使 用 方法 如 下 例 所 示 : 

"This isn't a test" 

‘Say "Good night," Gracie' 

和 字符 常量 以 整数 形式 存放 一 样 ， 字 符 串 常量 在 内 存 中 的 保存 形式 为 整数 字 节 数值 序 
列 。 例 如 ， 字 符 串 常量 “ABCD ”就 包含 四 个 字 节 41h、42h、43h、44h。 


3.1.7 保留 字 


保留 字 (reserved words) 有 特殊 意义 并 且 只 能 在 其 正确 的 上 下 文中 使 用 。 默 认 情 况 
下 ,保留 字 是 没有 大 小 写 之 分 的 。 比 如 ，MOYV 与 mov、Mov 是 相同 的 。 保 留 字 有 不 同 的 
类 型 : 

e 指令 助 记 符 ， 如 MOV、ADD 和 MUL。 

e 寄存 器 名 称 。 

e 伪 指 令 ， 告 诉 汇编 器 如 何 汇编 程序 。 

e 属性 ， 提 供 变量 和 操作 数 的 大 小 与 使 用 信息 。 例 如 BYTE 和 WORD。 

。 运算 符 ， 在 常量 表达 式 中 使 用 。 

e 预定 义 符 号 ， 比 如 @data， 它 在 汇编 时 返回 常量 的 整数 值 。 

附录 A 是 常用 的 保留 字 列表 。 
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3.1.8 标识 符 


标识 符 (identifier) 是 由 程序 员 选 择 的 名 称 ， 它 用 于 标识 变量 、 常 数 、 子 程序 和 代码 标 

标识 符 的 形成 有 一 些 规则 : 

e 可 以 包含 1 到 247 个 字符 . 

。 不 区 分 大 小 写 。 

e 第 一 个 字符 必须 为 字母 (A…Z，a…z)、 下 划 线 (_)、@、? 或 $。 其 后 的 字符 也 可 以 
是 数字 。 

。 标识 符 不 能 与 汇编 器 保留 字 相 同 。 


签 


0 


提示 可 以 在 运行 汇编 器 时 ,添加 -Cp 命令 行 切换 项 来 使 得 所 有 关键 宇和 标识 符 变 


成 大 小 写 敏 感 。 


通常 ， 在 高 级 编程 语言 代码 中 ,标识 符 使 用 描述 性 名 称 是 一 个 好 主意 。 尽 管 汇编 语言 指 
令 短 且 隐 星 ,但 没有 理由 使 得 标识 符 也 要 变 得 难以 理解 ! 下 面 是 一 些 命名 良好 的 名 称 : 





lineCount firstValue index line_count 
myFile xCoord main x_Coord 

下 面 的 名 称 合法 ,但 是 不 可 取 : 

_lineCount $first @myFile 


一 般 情况 下 ， 应 避免 用 符号 @ 和 下 划 线 作为 第 一 个 字符 ， 因 为 它们 既 用 于 汇编 器 ， 也 
用 于 高 级 语言 编译 器 。 


3.1.9 伪 指令 


伪 指 令 ( directive) 是 嵌入 源 代码 中 的 命令 ， 由 汇编 器 识别 和 执行 。 伪 指令 不 在 运行 时 
执行 ， 但 是 它们 可 以 定义 变量 、 宏 和 子 程序 ; 为 内 存 段 分 配 名 称 ， 执 行 许多 其 他 与 汇编 器 相 
关 的 日 常任 务 。 默 认 情况 下 ， 伪 指令 不 区 分 大 小 写 。 例 如 ，.data，.DAITA 和 .Data 是 相同 的 。 

下 面 的 例子 有 助 于 说 明 伪 指令 和 指令 的 区 别 。DWORD 伪 指令 告诉 汇编 器 在 程序 中 为 一 
个 双 字 变量 保留 空间 。 另 一 方面 ，MOYV 指令 在 运行 时 执行 ， 将 myVar 的 内 容 复制 到 EAX 
寄存 器 中 : 

myVar DWORD 26 

mov eax,myVar 

尽管 Intel 处 理 器 所 有 的 汇编 器 使 用 相同 的 指令 集 ， 但 是 通常 它们 有 着 不 同 的 伪 指 令 。 
比如 ，Microsoft 汇编 器 的 REPT 伪 指 令 对 其 他 一 些 汇编 器 就 是 无 法 识别 的 。 

定义 段 ”汇编 器 伪 指 令 的 一 个 重要 功能 是 定义 程序 区 段 ， 也 称 为 段 (segment)。 程序 中 
的 段 具 有 不 同 的 作用 。 如 下 面 的 例子 ， 一 个 段 可 以 用 于 定义 变量 ， 并 用 .DATA 伪 指 令 进行 
标识 : 


.data 
.CODE 伪 指 令 标 识 的 程序 区 段 包 含 了 可 执行 的 指令 : 


,Code 
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.STACK 伪 指 令 标识 的 程序 区 段 定义 了 运行 时 堆栈 ， 并 设置 了 其 大 小 : 

.Stack 100h 

附录 A 给 出 了 伪 指 令 和 运算 符 ， 是 一 个 有 用 的 参考 。 
3.1.10 ”指令 

指令 (instruction) 是 一 种 语句 ， 它 在 程序 汇编 编译 时 变 得 可 执行 。 汇 编 器 将 指令 翻译 为 
机 器 语言 字 节 ， 并 且 在 运行 时 由 CPU 加 载 和 执行 。 一 条 指令 有 四 个 组 成 部 分 : 

e 标号 (可 选 ) 

e 指令 助 记 符 (必需 ) 

e 操作 数 (通常 是 必需 的 ) 


e 注释 (可 选 ) 

不 同 部 分 的 位 置 安排 如 下 所 示 : 

[label:] mnemonic [operands] [;comment] 
现在 分 别 了 解 每 个 部 分 ， 先 从 标号 字段 开始 。 
1. 标号 


标号 (label) 是 一 种 标识 符 ， 是 指令 和 数据 的 位 置 标记 。 标 号 位 于 指令 的 前 端 ， 表 示 指 
令 的 地 址 。 同 样 ， 标 号 也 位 于 变量 的 前 端 ， 表 示 变 量 的 地 址 。 标 号 有 两 种 类 型 : 数据 标号 和 
代码 标号 。 

数据 标号 标识 变量 的 位 置 ， 它 提供 了 一 种 方便 的 手段 在 代码 中 引用 该 变量 。 比 如 ， 下 面 
定义 了 一 个 名 为 count 的 变量 : 


count DWORD 100 


汇编 器 为 每 个 标号 分 配 一 个 数字 地 址 。 可 以 在 一 个 标号 后 面 定 义 多 个 数据 项 。 在 下 面 的 
例子 中 ，array 定义 了 第 一 个 数字 ( 1024 ) 的 位 置 ， 其 他 数字 在 内 存 中 的 位 置 紧 随 其 后 : 


array DWORD 1024, 2048 
DWORD 4096, 8192 


变量 将 在 3.4.2 节 中 解释 ，MOYV 指令 将 在 4.1.4 节 中 解释 。 
程序 代码 区 (指令 所 在 区 段 ) 的 标号 必须 用 冒号 ( : ) 结束 。 代 码 标号 用 作 跳 转 和 循环 指 
令 的 目标 。 例 如 ， 下 面 的 JMP 指令 创建 一 个 循环 ， 将 程序 控制 传递 给 标号 target 标识 的 位 置 : 
target: 
mov ax, bx 


jmp target 


代码 标号 可 以 与 指令 在 同一 行 上 ， 也 可 以 自己 独立 一 行 ;: 
Ll: mov ax,bx 
L2: 
标号 命名 规则 与 3.1.8 节 中 说 明 的 标识 符 命名 规则 一 样 。 只 要 每 个 标号 在 其 封闭 子 程序 
中 是 唯一 的 ， 那 么 就 可 以 多 次 使 用 相同 的 标号 。 子 程序 将 在 第 5 章 中 讨论 。 
2. 指令 助 记 符 
间 令 助 记 符 〈 instruction mnemonic) 是 标记 一 条 指令 的 短 单词 。 在 英语 中 ， 助 记 符 是 帮 
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助 记忆 的 方法 。 相 似 地 ， 汇 编 语言 指令 助 记 符 ， 如 mov，add 和 sub， 给 出 了 指令 执行 操作 
类 型 的 线索 。 下 面 是 一 些 指令 助 记 符 的 例子 : 
| 
| 传送 分配 数值 | MuL | 
| 两 人 政 舍 ii | mp | 
| 从 一 个 数值 中 减 去 另 -个 数值 。 | CALL | 

3. 操作 数 

操作 数 是 指令 输入 输出 的 数值 。 汇 编 语言 指令 操作 数 的 个 数 范围 是 0 ~ 3 个 ， 每 个 操作 
数 可 以 是 寄存 器 、 内 存 操作 数 、 整 数 表达 式 和 输入 输出 端口 。 寄 存 器 命名 在 第 2 章 讨论 过 ， 
整数 表达 式 在 3.1.2 节 讨论 过 。 生 成 内 存 操作 数 有 不 同 的 方法 一 一 比如 ， 使 用 变量 名 、 带 方 
括号 的 寄存 器 ， 详 细 内 容 将 稍 后 讨论 。 变 量 名 暗示 了 变量 地 址 ， 并 指示 计算 机 使 用 给 定 地 址 
的 内 存 内 容 。 下 表 列 出 了 一 些 操作 数 示例 : 

示例 | 操作 数 类 型 | 


96 整数 常量 | eax 寄存 器 
244 整数 表达 式 | count | 内 存 


现在 来 考虑 一 些 包 含 不 同 个 数 操作 数 的 汇编 语言 指令 示例 。 比 如 , STC 指令 没有 操作 数 : 
stc ; 进位 标志 位 置 1 
INC 指令 有 一 个 操作 数 : 


















两 个 数值 相 乘 
跳 转 到 一 个 新 位 置 
调用 一 个 子 程序 





操作 数 类 型 





inc eax ?EAX 加 1 
MOYV 指令 有 两 个 操作 数 : 
mov count ,ebx ; 将 EBX 传送 给 变量 count 


操作 数 有 固有 顺序 。 当 指令 有 多 个 操作 数 时 ， 通 常 第 一 个 操作 数 被 称 为 目的 操作 数 ， 第 
二 个 操作 数 被 称 为 源 操作 数 (source operand)。 一 般 情 况 下 ， 目 的 操作 数 的 内 容 由 指令 修改 。 
比如 ， 在 MOV 指令 中 ,数据 就 是 从 源 操作 数 复制 到 目的 操作 数 。 

IMUL 指令 有 三 个 操作 数 ， 第 一 个 是 目的 操作 数 ， 第 二 个 和 第 三 个 是 进行 乘法 的 源 操 
作 数 : 


imul eax,ebx,5 


在 上 例 中 ，EBX 与 5 相 乘 ， 结 果 存 放 在 EAX 寄存 器 中 。 

4. 注释 

注释 是 程序 编写 者 与 阅读 者 交流 程序 设计 信息 的 重要 途径 。 程 序 清单 的 开始 部 分 通常 包 
含 如 下 信息 : 

e 程序 目标 的 说 明 

e 程序 创建 者 或 修改 者 的 名 单 

e 程序 创建 和 修改 的 日 期 

。 程序 实现 技术 的 说 明 

注释 有 两 种 指定 方法 : 

e 单行 注释 ， 用 分 号 ( ; ) 开始 。 汇 编 器 将 忽略 在 同一 行 上 分 号 之 后 的 所 有 字符 。 


[él 


L62 | 
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e 块 注释 ， 用 COMMENT 伪 指 令 和 一 个 用 户 定义 的 符号 开始 。 汇 编 器 将 忽略 其 后 所 有 
的 文本 行 ， 直 到 相同 的 用 户 定义 符号 出 现 为 止 。 示 例如 下 : 


COMMENT  ! 
This line is a comment. 


This line is also a comment. 
1 


其 他 符号 也 可 以 使 用 ， 只 要 该 符号 不 出 现在 注释 行 中 : 
COMMENT & 
This line is a comment. 


This line is also a comment. 
& 


当然 ， 程 序 员 应 该 在 整个 程序 中 提供 注释 ， 尤 其 是 代码 意图 不 太 明显 的 地 方 。 

5. NOP ( 空 操作 ) 指令 

最 安全 (也 是 最 无 用 ) 的 指令 是 NOP ( 空 操作 )。 它 在 程序 空间 中 占有 一 个 字 节 ， 但 是 
不 做 任何 操作 。 它 有 时 被 编译 器 和 汇编 器 用 于 将 代码 对 齐 到 有 效 的 地 址 边界 。 在 下 面 的 例子 
中 ， 第 一 条 指令 MOV 生成 了 3 字 节 的 机 器 代码 。NOP 指令 就 把 第 三 条 指令 的 地 址 对 齐 到 双 
字 边界 (4 的 偶数 倍 ): 


00000000 66 8B C3 mov ax,bx 


00000003 90 nop ; 对 齐 下 条 指令 

00000004 8B D1 mov edx,ecx 

x86 处 理 器 被 设计 为 从 双 字 的 偶数 倍 地 址 处 加 载 代码 和 数据 ， 这 使 得 加 载 速 度 更 快 。 
3.1.11 本 节 回 顾 


1. 使 用 数值 -35， 按 照 MASM 语法 ， 写 出 该 数值 的 十 进 制 、 十 六 进 制 、 八 进 制 和 二 进 制 格 
式 的 整数 常量 。 

2.( 是 / 否 ): A5h 是 一 个 有 效 的 十 六 进 制 常量 吗 ? 

3. (是 / 否 ): 整数 表达 式 中 ， 乘 法 运算 符 (*) 是 否 比 除 法 运算 符 (/) 具有 更 高 优先 级 ? 

4. 编写 一 个 整数 表达 式 ， 要 求 用 到 3.1.2 节 中 的 所 有 运算 符 。 计 算 该 表达 式 的 值 。 

5. 按照 MASM 语法 ， 写 出 实数 -6.2 x 10“ 的 实数 常量 。 

6. (是 /和 否 ): 字符 串 常量 必须 被 包含 在 单 引号 中 吗 ? 

7. 保留 字 可 以 用 作 指 令 助 记 符 、 属 性 、 运 算 符 、 预 定义 符号 ， 和 

8. 标识 符 的 最 大 长 度 是 多 少 ? 


3.2 示例 : 整数 加 减法 


o° 





3.2.1 AddTwo 程序 


现在 再 查看 一 下 本 章 开始 给 出 的 AddTwo 程序 ， 并 添加 必要 的 声明 使 其 成 为 完全 能 运行 
的 程序 。 请 记 住 ， 行 号 不 是 程序 的 实际 组 成 部 分 : 


1: ; AddTwo.asm - 两 个 32 位 整数 相 加 
2: ; 第 3 章 示 例 

3 

43 .386 

5: .model flat,stdcall 
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6: .Stack 4096 
7: ExitProcess PROTO, dwExitCode:DWORD 
8 . 


93 .code 


10: main PROC 

11: mov eax,5 7 数字 5 送 入 eax 寄存 器 
kp add eax,6 ?eax 青 存 器 加 6 

13; 

14: INVOKE ExitProcess,0 


15: main ENDP 

16: END main 

第 4 行 是 .386 伪 指 令 ， 它 表示 这 是 一 个 32 位 程序 ， 能 访问 32 位 寄存 器 和 地 址 。 第 5 
行 选择 了 程序 的 内 存 模式 ( flat)， 并 确定 了 子 程序 的 调用 规范 ( 称 为 stdcall)。 其 原因 是 32 
位 Windows 服务 要 求 使 用 stdcall 规范 。( 第 8 章 解 释 了 stdcall 是 如 何 工作 的 。) 第 6 行为 运 
行 时 堆栈 保留 了 4096 字 节 的 存储 空间 ， 每 个 程序 都 必须 有 。 

第 7 行 声 明了 ExitProcess 函数 的 原型 ， 它 是 一 个 标准 的 Windows 服务 。 原 型 包含 了 函 
数 名 、PROTO 关键 字 、 一 个 逗号 ， 以 及 一 个 输入 参数 列表 。ExitProcess 的 输入 参数 名 称 为 
dwExitCode。 可 以 将 其 看 作为 给 Windows 操作 系统 的 返回 值 ， 返 回 值 为 零 ， 则 表示 程序 执 
行 成 功 ; 而 任何 其 他 的 整数 值 都 表示 了 一 个 错误 代码 。 因 此 ， 程 序 员 可 以 将 自己 的 汇编 程序 
看 作 是 被 操作 系统 调用 的 子 程序 或 过 程 。 当 程序 准备 结束 时 ， 它 就 调用 ExitProcess， 并 向 操 
作 系 统 返回 一 个 整数 以 表示 该 程序 运行 良好 。 


更 多 信息 : 读者 可 能 会 好 奇 ， 为 什么 操作 系统 想 要 知道 程序 是 否 成 功 完 成 。 理 由 如 
下 : 与 按 序 执行 一 些 程序 相 比 ， 系 统管 理 员 常常 会 创建 脚本 文件 。 在 脚本 文件 中 的 每 一 
个 点 上 ， 系 统管 理 员 都 需要 知道 刚 执行 的 程序 是 否 失 败 ， 这 样 就 可 以 在 必要 时 退出 该 脚 
本 。 脚 本 通常 如 下 例 所 示 ， 其 中 ，ErrorLevell 表示 前 一 步 的 过 程 返回 码 大 于 或 等 于 1: 


Call program_1 

if ErrorLevel 1 goto FailedLabel 
call program_ 2 

if ErrorLevel 1 goto FailedLabel 
:SuccessLabel 

Echo Great, everything worked ! 


现在 回 到 AddTwo 程序 清单 。 第 16 行 用 end 伪 指令 来 标记 汇编 的 最 后 一 行 ， 同 时 它 
也 标识 了 程序 的 入口 (main)。 标 号 main 在 第 10 行进 行 了 声明 ， 它 标记 了 程序 开始 执行 的 
地 址 。 


提示 “在 显示 汇编 程序 代码 时 ，Visual Studio 的 语法 高 亮 显示 和 关键 字 下 的 波浪 线 
并 不 一 致 。 通 过 如 下 步骤 可 以 禁用 它 : 从 Tool 菜单 选择 Options， 继 续 选 择 Text Editor， 





选择 C/C++， 选 择 Advanced， 在 Intellisense 标题 下 ， 将 Disable Squiggles 设置 为 True。 
点 击 OK 关闭 Options 窗口 。 同 样 ， 记 住 MASM 大 小 写 不 敏感 ， 因 此 ， 程 序 员 可 以 随意 
进行 大 小 写 组 合 。 





汇编 伪 指 令 回 顾 
现在 回顾 一 些 在 示例 程序 中 使 用 过 的 最 重要 的 汇编 伪 指 令 。 
首先 是 .MODEL 伪 指 令 ， 它 告诉 汇编 程序 用 的 是 哪 一 种 存储 模式 : 


.model flat,stdcall 
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32 位 程序 总 是 使 用 平面 (flat) 存储 模式 ， 它 与 处 理 器 的 保护 模式 相关 联 。 保 护 模式 在 
第 2 章 中 已 经 讨论 过 了 。 关 键 字 stdcall 在 调用 程序 时 告诉 汇编 器 ， 怎 样 管理 运行 时 堆栈 。 
这 是 个 复杂 的 问题 ， 将 在 第 8 章 中 进行 探讨 。 然 后 是 .STACK 伪 指令 ， 它 告诉 汇编 器 应 该 为 
程序 运行 时 堆栈 保留 多 少 内 存 字 节 : 


.Stack 4096 


数值 4096 可 能 比 将 要 用 的 字 节 数 多 ， 但 是 对 处 理 器 的 内 存 管理 而 言 ， 它 正好 对 应 了 一 
个 内 存 页 的 大 小 。 所 有 的 现代 程序 在 调用 子 程序 时 都 会 用 到 堆栈 一 一 首先 ， 用 来 保存 传递 的 
参数 ; 其 次 ， 用 来 保存 调用 函数 的 代码 的 地 址 。 函 数 调用 结束 后 ，CPU 利用 这 个 地 址 返回 
到 函数 被 调用 的 程序 点 。 此 外 ， 和 运行 时 堆栈 还 可 以 保存 局 部 变量 ， 也 就 是 ,在 函数 内 定义 的 
变量 。 

.CODE 伪 指 令 标 记 一 个 程序 代码 区 的 起 点 ， 代 码 区 包含 了 可 执行 指令 。 通 常 ，.CODE 
的 下 一 行 声明 程序 的 人口 ， 按 照 惯例 ， 一 般 会 是 一 个 名 为 main 的 过 程 。 程 序 的 入 口 是 指 程 
序 要 执行 的 第 一 条 指令 的 位 置 。 用 下 面 两 行 来 传递 这 个 信息 : 


.code 
main PROC 


ENDP 伪 指令 标记 一 个 过 程 的 结束 。 如 果 程 序 有 名 为 main 的 过 程 ， 则 endp 就 必须 使 用 
同样 的 名 称 : 


main ENDP 
最 后 ，END 伪 指 令 标记 一 个 程序 的 结束 ， 并 要 引用 程序 和 人口 : 
END main 


如 果 在 END 伪 指令 后 面 还 有 更 多 代码 行 ， 它 们 都 会 被 汇编 程序 忽略 。 程 序 员 可 以 在 这 
里 放 各 种 内 容 一 一 程序 注释 ， 代 码 副 本 等 等 ， 都 无 关 紧 要 。 


3.2.2 ”运行 和 调试 AddTwo 程序 


使 用 Visual Studio 可 以 很 方便 地 编辑 、 构 建 和 运行 汇编 语言 程序 。 本 书 示例 文件 目录 中 
的 Project32 文件 夹 包含 了 Visual Studio 2012 Windows 控制 台 项 目 ， 该 文件 夹 已 经 按照 32 
位 汇编 语言 编程 进行 了 配置 。( 另 一 个 Project64 文件 夹 按照 64 位 汇编 进行 了 配置 .) 下 面 的 
步骤 ,按照 Visual Studio 2012， 说 明了 怎样 打开 示例 项 目 ， 并 创建 AddTwo 程序 : 

1 ) 打开 Project32 文件 夹 ， 双 击 Project.sln 文件 。 启 动 计 算 机 上 安装 的 最 新 版 本 的 
Visual Studio。 

2 ) 打开 Visual Studio 中 Solution Explorer 窗口 。 它 应 该 已 经 是 可 见 的 ， 但 是 程序 员 也 
可 以 在 View 菜单 中 选择 Solution Explorer 使 其 可 见 。 

3 ) 在 Solution Explorer 窗口 右键 点 击 项 目 名 称 ， 在 文本 菜单 中 选择 Add， 再 在 弹出 菜 
单 中 选择 New Item。 

4) 在 Add New File 对 话 窗口 中 ( 见 图 3-1)， 将 文件 命名 为 AddTwo.asm， 填 写 
Location 项 为 该 文件 选择 一 个 合适 的 磁盘 文件 夹 。 

5 ) 单 击 Add 按钮 保存 文件 。 

6 ) 键入 程序 源 代码 ， 如 下 所 示 。 这 里 大 写 关键 字 不 是 必需 的 : 





restes ER 








sl 


图 3-1 向 Visual Studio 项 目 添 加 一 个 新 的 源 代 码 文件 
) AddTwo.asm - adds two 32-bit integers . 


.386 

.model flat,stdcall 

.Stack 4096 

ExitProcess PROTO,dwExitCode:DWORD 


.Code 

main PROC 
mov eax,5 
add eax,6 


INVOKE ExitProcess,0 
main ENDP 
END main 


7 ) 在 Project 菜单 中 选择 Build Project， 查 看 Visual Studio 工作 区 底部 的 错误 消息 。 这 
被 称 为 错误 列表 窗口 。 图 3-2 展示 了 打开 并 运行 了 示例 程序 的 结果 。 注 意 ， 当 没有 错误 时 ， 
窗口 底部 的 状态 栏 会 显示 Build succeeded。 
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图 3-2 构建 Visual Studio 项目 
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1. 调试 演示 

下 面 将 展示 AddTwo 程序 的 一 个 示例 调试 会 话 。 本 书 还 未 向 读者 展示 直接 在 控制 台 窗 口 
显示 变量 值 ， 因 此 ， 我 们 将 在 调试 会 话 中 运行 程序 。 演 示 使 用 的 是 Visual Studio 2012, 不 
过 ， 自 2008 年 起 的 任何 版 本 的 Visual Studio 都 可 以 使 用 。 

运行 调试 程序 的 一 个 方法 是 在 Debug 菜单 中 选择 Step Over。 按 照 Visual Studio 的 配置 ， 
F10 功能 键 或 Shift+F8 组 合 键 将 执行 Step Over 命令 。 

开始 调试 会 话 的 另 一 种 方法 是 在 程序 语句 上 设置 断 点 ， 方 法 是 在 代码 窗口 左 侧 灰色 垂直 
条 中 直接 单 击 。 断 点 处 由 一 个 红色 大 圆 点 标识 出 来 。 然 后 就 可 以 从 Debug 菜单 中 选择 Start 
Debugging 开始 运行 程序 。 





图 3-3 显示 了 调试 会 话 开 始 时 的 程序 。 第 11 行 ， 第 一 条 MOYV 指令 ， 设 置 了 一 个 断 点 ， 
调试 器 已 经 暂停 在 该 行 ， 而 该 行 还 未 执行 。 当 调试 器 被 激活 时 ，Visual Studio 窗口 底部 的 状 
态 栏 变 为 橙色 。 当 调试 器 停止 并 返回 编辑 模式 时 ， 状 态 栏 变 为 蓝 色 。 可 视 提 示 是 有 用 的 ， 因 
为 在 调试 器 运行 时 ， 程 序 员 无 法 对 程序 进行 编辑 或 保存 。 
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图 3-3 ”调试 器 暂停 在 一 个 断 点 


图 3-4 显示 的 调试 程序 已 经 单 步 执行 了 11 行 和 12 行 ， 正 暂停 在 14 行 。 将 鼠标 悬 停 在 
EAX 寄存 器 名 称 上 ， 就 可 以 查看 其 当前 的 内 容 ( 11 )。 结 束 程序 运行 的 方法 是 在 工具 栏 上 单 
击 Continue 按钮 ， 或 者 是 单 击 (工具 栏 右 侧 的 ) 红色 的 Stop Debugging 按钮 。 

2. 自 定义 调试 接口 

在 调试 时 可 以 自 定义 调试 接口 。 例 如 ， 如 果 想 要 显示 CPU 寄存 器 ， 实 现 方法 是 ， 在 
Debug 菜单 中 选择 Windows， 然 后 再 选择 Registers。 图 3-5 显示 了 与 刚才 相同 的 调试 会 话 ， 
其 中 Registers 窗口 可 见 ， 同 时 还 关闭 了 一 些 不 重要 的 窗口 。EAX 数值 显示 为 0000000B， 
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是 十 进 制 数 11 的 十 六 进 制 表示 。 图 中 已 经 绘制 了 箭头 指向 该 值 。Registers 窗口 中 ，EFL 寄 
存 器 包含 了 所 有 的 状态 标志 位 〈 零 标志 、 进 位 标志 、 溢 出 标志 等 )。 如 果 在 Registers 窗口 中 
右键 单 击 ， 并 在 弹出 菜单 中 选择 Flags， 则 窗口 将 显示 单个 的 标志 位 值 。 示 例如 图 3-6 所 示 ， 
标志 位 从 左 到 右 依次 为 : OV (溢出 标志 位 )、UP (方向 标志 位 )、EI (中 断 标志 位 )、PL 
号 标志 位 )、ZR ( 零 标志 位 )、AC (辅助 进位 标志 位 )、PE (奇偶 标志 位 ) 和 CY (进位 标志 位 

这 些 标 志 位 准确 的 含义 将 在 第 4 章 进 行 说 明 。 
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图 3-5 在 调试 会 话 中 添加 Registers 窗口 
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图 3-6 在 Registers 窗口 中 显示 CPU 状态 标志 


Registers 窗口 的 一 个 重要 特点 是 ， 在 单 步 执行 程序 时 ， 任 何 寄 存 器 ， 只 要 当前 指令 修改 
了 它 的 数值 ， 就 会 变 为 红色 。 尽 管 无 法 在 打印 页 面 ( 它 只 有 黑白 两 色 ) 上 表示 出 来 ， 这 种 红 
色 高 亮 确实 显示 给 程序 员 ， 使 之 了 解 其 程序 是 怎样 影响 寄存 器 的 。 


提示 本 书 网 站 (asmirivine.com) 有 教程 展示 如 何 汇编 和 调试 汇编 语言 程序 。 





在 Visual Studio 中 运行 一 个 汇编 语言 程序 时 ， 它 是 在 控制 台 窗 口中 启动 的 。 这 个 窗口 
与 从 Windows 的 Start 菜单 运行 名 为 cmd.exe 程序 的 窗口 是 相同 的 。 或 者 ， 还 可 以 打开 项 目 
Debug\Bin 文件 夹 中 的 命令 提示 符 ， 直 接 从 命令 行 运行 应 用 程序 。 如 果 采 用 的 是 这 个 方法 ， 
程序 员 就 只 能 看 见 程序 的 输出 ， 其 中 包括 了 写 人 控制 台 窗口 的 文本 。 查 找 具 有 相同 名 称 的 可 
执行 文件 作为 Visual Studio 项 目 。 


3.2.3 ”程序 模板 


汇编 语言 程序 有 一 个 简单 的 结构 ， 并 且 变 化 很 小 。 当 开始 编写 一 个 新 程序 时 ， 可 以 从 一 
个 空 shell 程序 开始 ， 里 面 有 所 有 基本 的 元 素 。 通 过 填写 缺 省 部 分 ， 并 在 新 名 字 下 保存 该 文 
件 就 可 以 避免 键 和 多余 的 内 容 。 下 面 的 程序 ( Template.asm) 易于 自 定义 。 注 意 ,插入 的 注 
释 标注 了 程序 员 添 加 自己 代码 的 地 方 。 关 键 字 大 小 写 均 可 : 

; 程序 模板 (Template.asm) 

.386 

.model flat,stdcall 


.stack 4096 
ExitProcess PROTO, dwExitCode:DWORD 


.data 

; 在 这 里 声明 变量 
.Code 
main PROC 

; 在 这 里 编写 自己 的 代码 


INVOKE ExitProcess,0 
main ENDP 
END main 


使 用 注释 在 注释 中 包括 程序 说 明 、 程 序 作 者 的 名 字 、 创 建 日 期 以 及 后 续 修改 信息 ， 
是 一 个 非常 好 的 主意 。 这 种 文档 对 任何 阅读 程序 清单 的 人 (包括 程序 员 自 己 ， 儿 个 月 或 几 年 
之 后 ) 都 是 有 帮助 的 。 许 多 程序 员 已 经 发 现 了 ， 程 序 编 写 几 年 后 ， 他 们 必须 先 重新 熟悉 自己 
的 代码 才能 进行 修改 。 如 果 读 者 正在 上 编程 课 ， 那 么 老师 可 能 会 坚持 要 求 使 用 这 些 附加 信息 。 


3.2.4 本 节 回 顾 
1. 在 AddTwo 程序 中 ，ENDP 伪 指 令 的 含义 是 什么 ? 
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2. 在 AddTwo 程序 中 ，.CODE 伪 指令 标识 了 什么 ? 
3.AddTwo 程序 中 两 个 段 的 名 称 是 什么 ? 

4. 在 AddTwo 程序 中 ， 哪 个 寄存 器 保存 了 和 数 ? 
5. 在 AddTwo 程序 中 ， 哪 条 语句 使 程序 停止 ? 


3.3 汇编、 链接 和 运行 程序 


用 汇编 语言 编写 的 源 程序 不 能 直接 在 其 目标 计算 机 上 执行 ， 必 须 通 过 翻译 或 汇编 将 其 转 
换 为 可 执行 代码 。 实 际 上 ， 汇 编 器 与 编译 器 ( compiler) 很 相似 ， 编 译 器 是 一 类 程序 ， 用 于 
将 C++ 或 Java 程序 翻译 为 可 执行 代码 。 

汇编 器 生成 包含 机 器 语言 的 文件 ， 称 为 目标 文件 ( object file)。 这 个 文件 还 没有 准备 好 
执行 ， 它 还 需 传 递 给 一 个 被 称 为 链接 器 (linker) 的 程序 ， 从 而 生成 可 执行 文件 ( executable 
file)。 这 个 文件 就 准备 好 在 操作 系统 命令 提示 符 下 执行 。 

3.3.1 汇编 -链接 -执行 周期 

图 3-7 总 结 了 编辑 、 汇 编 、 链 接 和 执行 汇编 语言 程序 的 过 程 。 下 面 详细 说 明 每 一 个 步骤 。 

步骤 1: 编程 者 用 文本 编辑 器 (text editor) 创建 一 个 ASCII 文本 文件 ， 称 之 为 源 文件 。 

步骤 2: 汇编 器 读 取 源 文件 ， 并 生成 目标 文件 ， 即 对 程序 的 机 器 语言 翻译 。 或 者 ， 它 也 
会 生成 列表 文件 。 只 要 出 现任 何 错误 ， 编 程 者 就 必须 返回 步骤 1， 修 改 程序 。 

步骤 3: 链接 器 读 取 并 检查 目标 文件 ， 以 便 发 现 该 程序 是 否 包 含 了 任何 对 链接 库 中 过 程 
的 调用 。 链 接 器 从 链接 库 中 复制 任何 被 请 求 的 过 程 ， 将 它们 与 目标 文件 组 合 ， 以 生成 可 执行 
文件 。 

步骤 4: 操作 系统 加 载 程 序 将 可 执行 文件 读 人 内 存 ， 并 使 CPU 分 支 到 该 程序 起 始 地 址 ， 
然后 程序 开始 执行 。 

参见 本 书 作者 网 站 ( www.asmirvine.com) 的 “ Getting Started ”标题 ， 获 取 Microsoft 
Visual Studio 对 汇编 语言 程序 进行 汇编 、 链 接 和 运行 的 详细 指令 。 







步骤 4: 





3-7 汇编 -链接 一 执行 周期 


步骤 1: 文本 编辑 器 


3.3.2 ”列表 文件 


列表 文件 ( listing file) 包括 了 程序 源 文件 的 副本 ， 再 加 上 行 号 、 每 条 指令 的 数字 地 址 、 
每 条 指令 的 机 器 代码 字 节 (十 六 进 制 ) 以 及 符号 表 。 符 号 表 中 包含 了 程序 中 所 有 标识 符 的 名 
称 、 段 和 相关 信息 。 高 级 程序 员 有 时 会 利用 列表 文件 来 获得 程序 的 详细 信息 。 图 3-8 展示 了 
AddTwo 程序 的 部 分 列表 文件 ， 现 在 进一步 查看 这 个 文件 。1 ~ 7 行 没 有 可 执行 代码 ， 因 此 
它们 原封 不 动 地 从 源 文件 中 直接 复制 过 来 。 第 9 行 表示 代码 段 开 始 的 地 址 为 0000 0000 (在 
32 位 程序 中 ， 地 址 显示 为 8 个 十 六 进 制 数字 )。 这 个 地 址 是 相对 于 程序 内 存 占 用 起 点 而 言 
的 ， 但 是 ， 当 程序 加 载 到 内 存 中 时 ， 这 个 地 址 就 会 转换 为 绝对 内 存 地 址 。 此 时 ， 该 程序 就 会 
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从 这 个 地 址 开始 ， 比 如 0004 0000h。 


; AddTwo.asm - adds two 32-bit integers. 
; Chapter 3 example 


.386 

-model flat,stdcall 

.stack 4096 

ExitProcess PROTO,dwExitCode:DWORD 


| 
2 
E 
4: 
5 
6s 
和 
8 : 


00000000 .Code 
00000000 main PROC 
00000000 B8 00000005 mov eax,5 
00000005 83 C0 06 add eax,6 


invoke ExitProcess,0 
00000008 6A 00 push +000000000h 
0000000A E8 00000000 E call ExjitProcess 
0000000F main ENDP 
END main 





图 3-8 AddTwo 源 列 表 文 件 摘录 


第 10 行 和 第 11 行 也 显示 了 相同 的 开始 地 址 0000 0000， 原 因 是 : 第 一 条 可 执行 语句 是 
MOYV 指令 ， 它 在 第 11 行 。 请 注意 第 11 行 中 ， 在 地 址 和 源 代码 之 间 出 现 了 几 个 十 六 进 制 字 
节 ， 这 些 字 节 (B8 0000 0005 ) 代表 的 是 机 器 代码 指令 ( B8 )， 而 该 指令 分 配给 EAX 的 就 是 
32 位 常数 值 ( 0000 0005 ): 


11: 00000000 B8 00000005 mov eax 5 


数值 B8 也 被 称 为 操作 代码 (或 简称 为 操作 码 )， 因 为 它 表 示 了 特定 的 机 器 指令 ， 将 一 个 
32 位 整数 送 入 eax 寄存 器 。 第 12 章 将 非常 详细 地 介绍 x86 机 器 指令 架构 。 

第 12 行 也 是 一 条 可 执行 指令 ， 起 始 偏 移 量 为 0000 0005。 这 个 偏 移 量 是 指 从 程序 起 始 地 
址 开始 5 个 字 节 的 距离 。 也 许 ， 读 者 能 猜 出 来 这 个 偏 移 量 是 怎么 算出 来 的 。 

第 14 行 有 invoke 伪 指 令 。 注 意 第 15 行 和 16 行 是 如 何 插入 到 这 段 代码 中 的 ,插入 代码 
的 原因 是 ，INVOKE 伪 指 令 使 得 汇编 器 生成 PUSH 和 CALL 语句 ， 它 们 就 显示 在 第 15 行 和 
16 行 。 第 5 章 将 讨论 如 何 使 用 PUSH 和 CALL。 

图 3-8 中 展示 的 示例 列表 文件 说 明了 机 器 指令 是 怎样 以 整数 值 序列 的 形式 加 载 到 内 存 的 ， 
在 这 里 用 十 六 进 制 表示 : B8、0000 0005、83 、C0、06 、6A、00、EB 、0000 0000。 每 个 数 中 
包含 的 数字 个 数 暗示 了 位 的 个 数 : 2 个 数字 就 是 8 位 , 4 个 数字 就 是 16 位 , 8 个 数字 就 是 32 位 ， 
以 此 类 推 。 所 以 ， 本 例 机 器 指令 长 正好 是 15 个 字 节 (2 个 4 字 节 值 和 7 个 1 字 节 值 )。 

当 程 序 员 想 要 确认 汇编 器 是 否 按照 自己 的 程序 生成 了 正确 的 机 器 代码 字 节 时 ， 列 表 文 件 
就 是 最 好 的 资源 。 如 果 是 刚 开 始 学 习 机 器 代码 指令 是 如 何 生成 的 ， 列 表 文 件 也 是 一 个 很 好 的 
教学 工具 。 


提示 若 想 告诉 Visual Studio 生成 列表 文件 ， 则 在 打开 项 目 时 按 下 述 步骤 操作 : 在 
Project 菜单 中 选择 Properties， 在 Configuration Properties 下 ， 选 择 Microsoft Macro 
Assembler。 然 后 选择 Listing File。 在 对 话 框 中 ， 设 置 Generate Preprocessed Source 
Listing 为 Yes， 设 置 List All Available Information 为 Yes。 对 话 框 如 图 3-9 所 示 。 
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图 3-9 配置 Visual Studio 以 生成 列表 文件 


列表 文件 的 其 他 部 分 包含 了 结构 和 联合 列表 ， 以 及 过 程 、 参 数 和 局 部 变量 。 这 里 没有 显 
示 这 些 内 容 ,但 是 后 续 章 节 将 对 它们 进行 讨论 。 


3.3.3 ”本 节 回 顾 


1. 汇编 器 生成 什么 类 型 的 文件 ? 

2.( 真 / 假 ): 链接 器 从 链接 库 中 抽取 已 汇编 程序 ， 并 将 其 插入 到 可 执行 程序 中 。 

3.( 真 / 假 ): 程序 源 代 码 修改 后 ， 它 必须 再 次 进行 汇编 和 链接 才能 按照 修改 内 容 执行 。 

4. 操作 系统 的 哪 一 部 分 来 读 取 和 执行 程序 ? 

5. 链接 器 生成 什么 类 型 的 文件 ? [3 


3.4 定义 数据 


3.4.1 内 部 数据 类 型 


汇编 器 识别 一 组 基本 的 内 部 数据 类 型 (intrinsic data type)， 按 照 数 据 大 小 ( 字 节 、 字 、 
双 字 等 等 )、 是 否 有 符号 、 是 整数 还 是 实数 来 描述 其 类 型 。 这 些 类 型 有 相当 程度 的 重合 一 一 
例如 ，DWORD 类 型 (32 位 ， 无 符号 整数 ) 就 可 以 和 SDWORD 类 型 (32 位 ， 有 符号 整数 ) 
相互 交换 。 可 能 有 人 会 说 ,程序 员 用 SDWORD 告诉 读 程序 的 人 ， 这 个 值 是 有 符号 的 ， 但 
是 ， 对 于 汇编 器 来 说 这 不 是 强制 性 的 。 汇 编 器 只 评估 操作 数 的 大 小 。 因 此 ， 举 例 来 说 ,程序 
员 只 能 将 32 位 整数 指定 为 DWORD、SDWORD 或 者 REAL4 类 型 。 表 3-2 给 出 了 全 部 内 部 
数据 类 型 的 列表 ， 有 些 表 项 中 的 IEEE 符号 指 的 是 IEEE 计算 机 学 会 出 版 的 标准 实数 格式 。 


3.4.2 ”数据 定义 语句 


数据 定义 语句 〈data definition statement) 在 内 存 中 为 变量 留 出 存储 空间 ， 并 赋予 一 个 可 
选 的 名 字 。 数 据 定义 语句 根据 内 部 数据 类 型 ( 表 3-2 ) 定义 变量 。 数 据 定义 语法 如 下 所 示 : 


[name] directive initializer [,initializer]... 
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表 3-2 ”内 部 数据 类 型 


类 型 用 法 
BYTE 8 位 无 符号 整数 ，B 代表 字 节 
SBYTE 8 位 有 符号 整数 ，S 代表 有 符号 
WORD 16 位 无 符号 整数 
SWORD 16 位 有 符号 整数 
DWORD 32 位 无 符号 整数 ，D 代表 双 ( 字 ) 
SDWORD 32 位 有 符号 整数 ，SD 代表 有 符号 双 ( 字 ) 
FWORD 48 位 整数 (保护 模式 中 的 远 指针 ) 
QWORD 64 位 整数 ，Q 代表 四 ( 字 ) 
TBYTE 80 位 (10 字 节 ) 整数 , T 代 表 10 字 节 
REAL4 32 位 (4 字 节 ) IEEE 短 实数 
REAL8 64 位 (8 字 节 ) IEEE 长 实数 
REAL10 80 位 (10 字 节 ) IEEE 扩展 实数 


下 面 是 数据 定义 语句 的 一 个 例子 : 
count DWORD 12345 


名 字 ”分 配给 变量 的 可 选 名 字 必 须 遵 守 标 识 符 规范 (参见 3.1.8 节 )。 
伪 指 令 ”数据 定义 语句 中 的 伪 指 令 可 以 是 BYTE、WORD、DWORD、SBTYE、SWORD， 
或 其 他 在 表 3-2 中 列 出 的 类 型 。 此 外 ， 它 还 可 以 是 传统 数据 定义 伪 指令 ， 如 表 3-3 所 示 。 
表 3-3 传统 数据 伪 指令 


64 位 整数 或 实数 


定义 80 位 (10 字 节 ) 整数 





初始 值 ” 数 据 定义 中 至 少 要 有 一 个 初始 值 ， 即 使 该 值 为 0。 其 他 初始 值 ， 如 果 有 的 话 ， 
用 逗号 分 隔 。 对 整数 数据 类 型 而 言 ， 初 始 值 ( initializer) 是 整数 常量 或 是 与 变量 类 型 ， 如 
BTYE 或 WORD 相 匹 配 的 整数 表达 式 。 如 果 程 序 员 希 望 不 对 变量 进行 初始 化 (随机 分 配 数 
值 )， 可 以 用 符号 ? 作为 初始 值 。 所 有 初始 值 ， 不 论 其 格式 ， 都 由 汇编 器 转换 为 二 进 制 数据 。 
初始 值 0011 0010b 、32h 和 50d 都 具有 相同 的 二 进 制 数值 。 


3.4.3 向 AddTwo 程序 添加 一 个 变量 


本 章 开始 时 介绍 了 AddTwo 程序 ， 现 在 创建 它 的 一 个 新 版 本 ， 并 称 为 AddTwoSum。 这 
个 版 本 引入 了 变量 sum， 它 出 现在 完整 的 程序 清单 中 : 


: ; RMddTwoSum.asm - 第 3 章 示例 


下 
2 
3 .386 

4 .model flat,stdcall 

Ss .Stack 4096 

6: ExitProcess PROTO, dGwExitCode:DWORD 
7: 

8 

9 

0 


.data 
和 sum DWORD 0 
10%3 
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11: -code 

12: main PROC 

二 六 mov eax, 5 

14; add eax,6 

15s mov sum,eax 

16s 

7 INVOKE ExitProcess,0 
上 8 main ENDP 

19; END main 


可 以 在 第 13 行 设 置 断 点 ， 每 次 执行 一 行 ， 在 调试 器 中 单 步 执行 该 程序 。 执 行 完 第 15 行 
后 ， 将 鼠标 悬 停 在 变量 sum 上 ， 查 看 其 值 , 或 者 打开 一 个 Watch 窗口 ， 打 开 过 程 如 下 : 在 
Debug 菜单 中 选择 Windows (在 调试 会 话 中 )， 选 择 Watch， 并 在 四 个 可 用 选项 ( Watch1 ， 
Watch2，Watch3 或 Watch4 ) 中 选择 一 个 。 然 后 ， 用 鼠标 高 亮 显 示 sum 变量 ,将 其 拖拉 到 
Watch 窗口 中 。 图 3-10 展示 了 一 个 例子 ， 其 中 用 大 箭头 指出 了 执行 第 15 行 后 ，sum 的 当 
前 值 。 
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图 3-10 在 调试 会 话 中 使 用 Watch 窗口 


3.4.4 定义 BYTE 和 SBYTE 数据 


BYTE (定义 字 节 ) 和 SBYTE (定义 有 符号 字 节 ) 为 一 个 或 多 个 无 符号 或 有 符号 数值 分 
配 存储 空间 。 每 个 初始 值 在 存储 时 ， 都 必须 是 8 位 的 。 例 如 : 


valuel BYTE 'A' ; 字符 常量 

value2 BYTE 0 ; 最 小 无 符号 字 节 
value3 BYTE 255 ; 最 大 无 符号 字 节 
value4 SBYTE -128 ; 最 小 有 符号 字 节 
value5 SBYTE +127 ; 最 大 有 符号 字 节 


问号 (? ) 初始 值 使 得 变量 未 初始 化 ， 这 意味 着 在 运行 时 分 配 数值 到 该 变量 : 


Value6 BYTE ? 


[76 ] 
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可 选 名 字 是 一 个 标号 ， 标 识 从 变量 包含 段 的 开始 到 该 变量 的 偏 移 量 。 比 如 ， 如 果 valuel 
在 数据 段 偏 移 量 为 0000 处 ， 并 在 内 存 中 占 一 个 字 节 ， 则 value2 就 自动 处 于 偏 移 量 为 0001 处 : 


valuel BYTE 10h 
value2 BYTE 20h 


DB 伪 指令 也 可 以 定义 有 符号 或 无 符号 的 8 位 变量 : 


vall DB 255 ; 无 符号 字 节 
val2 DB -128  ; 有 符号 字 节 
1. 多 初始 值 


如 果 同 一 个 数据 定义 中 使 用 了 多 个 初始 值 ， 那 么 它 的 标号 只 指出 第 一 个 初始 值 的 偏 移 
量 。 在 下 面 的 例子 中 ， 假 设 list 的 偏 移 量 为 0000。 那 么 ， 数 值 10 的 偏 移 量 就 为 0000，20 的 
偏 移 量 为 0001，30 的 偏 移 量 为 0002，40 的 偏 移 量 为 0003 : 


list BYTE 10,20,30,40 偏 移 量 数值 

图 3-11 给 出 了 字 节 序列 list， 显 示 了 每 个 字 节 及 其 偏 移 量 。 oi 

并 不 是 所 有 的 数据 定义 都 要 用 标号 。 比 如 ， 在 list 后 面 继续 添加 字 。 0002; 

节 数 组 ， 就 可 以 在 下 一 行 定义 它们 : oo03: [40 | 
list BYTE 10,20,30,40 图 3-11 一 个 字 节 
ee sp np 序列 的 内 存 排列 


在 单个 数据 定义 中 ， 其 初始 值 可 以 使 用 不 同 的 基数 。 字 符 和 字符 串 常 量 也 可 以 自由 组 
合 。 在 下 面 的 例子 中 ，listl 和 list2 有 相同 的 内 容 : 

listl BYTE 10，32，41h，00100010b 

lJist2 BYTE 0， 20h, 'A', 22h 

2. 定义 字符 串 

定义 一 个 字符 串 ， 要 用 单 引号 或 双 引 号 将 其 括 起 来 。 最 常见 的 字符 串 类 型 是 用 一 个 空 字 
节 ( 值 为 0 ) 作为 结束 标记 ， 称 为 以 空 字 节 结 束 的 字符 串 ， 很 多 编程 语言 中 都 使 用 这 种 类 型 的 
字符 串 : 


greetingl BYTE "Good afternoon",0 
greeting2 BYTE 'Good night' ,0 


每 个 字符 占 一 个 字 节 的 存储 空间 。 对 于 字 节 数值 必须 用 逗号 分 隔 的 规则 而 言 ， 字 符 串 是 
一 个 例外 。 如 果 没 有 这 种 例外 ，greeting1 就 会 被 定义 为 : 


Sroetingl BYTE "Oo, Dd se nlbe. 


这 就 显得 很 见长 。 一 个 字符 串 可 以 分 为 多 行 ， 并 且 不 用 为 每 一 行 都 添加 标号 : 
greetingl BYTE "Welcome to the Encryption Demo program " 
BYTE "created by Kip Irvine.",0dh,0ah 
BYTE "If you wish to modify this program, please " 
BYTE “send me a copy.",0dh,0ah,0 
十 六 进 制 代码 0Dh 和 0Ah 也 被 称 为 CR/ILF ( 回 车 换行 符 ) 或 行 结束 字符 。 在 编写 标准 
输出 时 ， 它 们 将 光标 移动 到 当前 行 的 下 一 行 的 左 侧 。 
行 连续 字符 (\) 把 两 个 源 代码 行 连接 成 一 条 语句 ， 它 必须 是 一 行 的 最 后 一 个 字符 。 下 面 
的 语句 是 等 价 的 : 
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greetingl BYTE "Welcome to the Encryption Demo program " 


和 


greetingl \ 
BYTE "Welcome to the Encryption Demo program " 


3. DUP 操作 符 
DUP 操作 符 使 用 一 个 整数 表达 式 作 为 计数 器 ， 为 多 个 数据 项 分 配 存储 空间 。 在 为 字符 
串 或 数组 分 配 存储 空间 时 ， 这 个 操作 符 非常 有 用 ， 它 可 以 使 用 初始 化 或 非 初始 化 数据 : 


BYTE 20 DUP(0) 720 个 字 节 ， 值 都 为 0 
BYTE 20 DUP(?) ;20 个 字 节 ， 非 初始 化 
BYTE 4 DUP("STRCK") ;20 个 字 节 : 


3.4.5 定义 WORD 和 SWORD 数据 

WORD (定义 字 ) 和 SWORD (定义 有 符号 字 ) 伪 指 令 为 一 个 或 多 个 16 位 整数 分 配 存 储 
空间 : 

wordl WORD 65535 ; 最 大 无 符号 数 


word2 SWORD -32768 ;最 小 有 符号 数 
word3 WORD 3? ; 未 初始 化 ， 无 符号 


也 可 以 使 用 传统 的 DW 伪 指 令 : 


vall DW 65535 ;无 符号 
val2 DW -32768 ; 有 符号 


16 位 字数 组 ”通过 列举 元 素 或 使 用 DUP 操作 符 来 创建 字数 组 。 下 面 的 数组 包含 了 一 组 
数值 : 


myList WORD 1,2,3,4,5 
图 3-12 是 一 个 数组 在 内 存 中 的 示意 图 ， 假设 myList 起 始 位 置 


偏 移 量 为 0000。 由 于 每 个 数值 占 两 个 字 节 ， 因 此 其 地 址 递增 量 为 2。 
DUP 操作 符 提 供 了 一 种 方便 的 方法 来 声明 数组 : 


array WORD 5 DUP(?) ;5 个 数值 ， 未 初始 化 





图 3-12 ”16 位 字数 组 的 

3.4.6 定义 DWORD 和 SDWORD 数据 内 存 排列 

DWORD (定义 双 字 ) 和 SDWORD (定义 有 符号 双 字 ) 伪 指 令 为 一 个 或 多 个 32 位 整数 
分 配 存储 空间 : 

vall DWORD ”12345678h ;无 符号 

val2 SDWORD -2147483648 ; 有 符号 

val3 DWORD 20 DUP(?) ;无 符号 数组 

传统 的 DD 伪 指 令 也 可 以 用 来 定义 双 字 数据 : 

vall DD 12345678h ;? 无 符号 

val2 DD -2147483648 ;有 符号 

DWORD 还 可 以 用 于 声明 一 种 变量 ， 这 种 变量 包含 的 是 另 一 个 变量 的 32 位 偏 移 量 。 如 
下 所 示 ，pVal 包含 的 就 是 val3 的 偏 移 量 : 
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pVal DWORD val3 


32 位 双 字 数组 ”现在 定义 一 个 双 字数 组 ， 并 显 式 初 始 化 它 的 每 
= 


myList DWORD 1,2,3,4,5 


图 3-13 给 出 了 这 个 数组 在 内 存 中 的 示意 图 ， 假设 myList 起 始 位 
置 偏 移 量 为 0000， 偏 移 量 增 量 为 4。 





图 3-13 ”32 位 双 字 数组 
3.4.7 ”定义 QWORD 数据 的 内 存 排列 


QWORD (定义 四 字 ) 伪 指 令 为 64 位 (8 字 节 ) 数值 分 配 存储 空间 : 
quadl QWORD 1234567812345678h 
传统 的 DQ 伪 指 令 也 可 以 用 来 定义 四 字数 据 : 


quadl1l DQ 1234567812345678h 


3.4.8 定义 压缩 BCD (TBYTE) 数据 


Intel 把 一 个 压缩 的 二 进 制 编码 的 十 进 制 (BCD ，Binary Coded Decimal) 整数 存放 在 一 
个 10 字 节 的 包 中 。 每 个 字 节 (除了 最 高 字 节 之 外 ) 包含 两 个 十 进 制 数字 。 在 低 9 个 存储 字 
节 中 ， 每 半 个 字 节 都 存放 了 一 个 十 进 制 数字 。 最 高 字 节 中 ， 最 高 位 表示 该 数 的 符号 位 。 如 
果 最 高 字 节 为 80h， 该 数 就 是 负数 ;如 果 最 高 字 节 为 00h， 该 数 就 是 正 数 。 整 数 的 范围 是 
—999 999 999 999 999 999 到 +999 999 999 999 999 999。 

示例 下 表 列 出 了 正 、 负 十 进 制 数 1234 的 十 六 进 制 存 储 字 节 ， 排 列 顺序 从 最 低 有 效 字 
节 到 最 高 有 效 字 节 ; 


十 进 制 数值 存储 字 节 
+1234 34 12 00 00 00 00 00 00 00 00 
—1234 34 12 00 00 00 00 00 00 00 80 


MASM 使 用 TBYTE 伪 指 令 来 定义 压缩 BCD 变量。 常数 初始 值 必 须 是 十 六 进 制 的 ， 
因为 ， 汇 编 器 不 会 自动 将 十 进 制 初始 值 转换 为 BCD 码 。 下 面 的 两 个 例子 展示 了 十 进 制 
数 -1234 有 效 和 无 效 的 表达 方式 : 


intVal TBYTE 800000000000001234h ;有效 
intVal TBYTE -1234 ; 无 效 


第 二 个 例子 无 效 的 原因 是 MASM 将 常数 编码 为 二 进 制 整数 ， 而 不 是 压缩 BCD 整数 。 
如 果 想 要 把 一 个 实数 编码 为 压缩 BCD 码 ， 可 以 先 用 FLD 指令 将 该 实数 加 载 到 浮 点 寄存 
器 堆栈 ， 再 用 FBSTP 指令 将 其 转换 为 压缩 BCD 码 ， 该 指令 会 把 数值 伟人 到 最 接近 的 整数 : 


.data 
posVal REAL8 1.5 
bcaVal TBYTE ? 


.code 
fld posVal ;加载 到 浮 点 堆栈 
fbstp bcdVal ; 向 上 侈 入 到 2， 压 缩 BCD 码 值 
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如 果 posVal 等 于 1.5， 结 果 BCD 值 就 是 2。 第 7 章 将 学 习 怎 样 用 压缩 BCD 值 进行 算术 


3.4.9 定义 浮 点 类 型 


REAL4 定义 4 字 节 单 精 度 浮 点 变量 。REAL8 定义 8 字 节 双 精 度数 值 ，REAL10 定义 10 
字 节 扩展 精度 数值 。 每 个 伪 指 令 都 需要 一 个 或 多 个 实 常数 初始 值 ; 


rVall REAL4 -1.2 
rVal2 REAL8 3.2E-260 
rVal3 RERAL10 4.6E+4096 


ShortArray REAL4 20 DUP(0.0) 


表 3-4 描述 了 标准 实 类 型 的 最 少 有 效 数 字 个 数 和 近似 范围 : 
表 3-4 ”标准 实数 类 型 


近似 范围 
1.18 x 10™ to 3.40 x 10% 


2.23x10™ to1.79x10" 





扩展 精度 实数 5937 又 10 的 二 二 Xi10989 
DD、DQ 和 DT 伪 指 令 也 可 以 定义 实数 : 
zVall DD -1.2 ; 短 实数 
rVal2 DQ 3.2E-260 ; 长 实数 


rVal3 DT 4.6E+4096 ;扩展 精度 实数 


说 明 : MASM 汇编 器 包含 了 诸如 real4 和 real8 的 数据 类 型 ， 这些 类 型 表明 数值 是 实 


数 。 更 准确 地 说 ， 这 些 数值 是 浮 点 数 ， 其 精度 和 范围 都 是 有 限 的 。 从 数学 的 角度 来 看 ， 
实数 的 精度 和 大 小 是 无 限 的 。 





3.4.10 ”变量 加 法 程序 


到 目前 为 止 ， 本 章 的 示例 程序 实现 了 存储 在 寄存 器 中 的 整数 加 法 。 现 在 已 经 对 如 何 定义 
数据 有 了 一 些 了 解 ， 那 么 可 以 对 同样 的 程序 进行 修改 ,使 之 实现 三 个 整数 变量 相 加 ， 并 将 和 
数 存 放 到 第 四 个 变量 中 。 


1: ; AddVariables.asm - 第 3 章 示例 
2 

3 .386 

4 .model flat,stdcall 

5: .Stack 4096 

6: ExitProcess PROTO, dwExitCode:DWORD 
3 

8: .data 

9: firstval DWORD 20002000h 
10: secondval DWORD 11111111h 
14: thirdval DWORD 22222222h 
23 sum DWORD 0 
3 
14: -code 

二 5 main PROC 

16 : mov eax,firstval 
L173 add eax,secondval 


18: add eax,thirdval 


62 和 甸 3 茧 





19 mov sum,eax 

20: 

1 INVOKE ExitProcess,0 
FP main ENDP 

233 END main 


注意 , 已 经 用 非 零 数 值 对 三 个 变量 进行 了 初始 化 (9 一 11 行 )。16 ~ 18 行 进行 变量 相 
加 。x86 指令 集 不 允许 将 一 个 变量 直接 与 男 一 个 变量 相 加 ,但 是 允许 一 个 变量 与 一 个 寄存 器 
相 加 。 这 就 是 为 什么 16 ~ 17 行 用 EAX 作 累 加 器 的 原因 : 

16;; mov eax,firstval 

4175 add eax,secondval 

第 17 行 之 后 ，EAX 中 包含 了 firstval 和 secondval 之 和 。 接 着 ,第 18 行 把 thirdval 加 到 
EAX 中 的 和 数 上 : 


i183 add eax,thirdval 
最 后 ， 在 第 19 行 ， 和 数 被 复制 到 名 称 为 sum 的 变量 中 : 
19 : mov Sum, eaX 


作为 练习 ， 鼓 励 读者 在 调试 会 话 中 运行 本 程序 ， 并 在 每 条 指令 执行 后 检查 每 个 寄存 器 。 
最 终 和 数 应 为 十 六 进 制 的 53335333。 


提示 “在 调试 会 话 过 程 中 ， 如 果 想 要 变量 显示 为 十 六 进 制 ， 则 按 下 述 步 骤 操 作 : 饼 


标 在 变量 或 寄存 器 上 是 和 停 1 秒 ， 直 到 一 个 灰色 短 形 框 出 现在 鼠标 下 。 右 键 点 击 该 矩形 
框 ， 在 弹出 菜单 中 选择 Hexadecimal Display。 





3.4.11 小 端 顺序 


x86 处 理 器 在 内 存 中 按 小 端 (little-endian) 顺序 ( 低 到 高 ) 0000: 
存放 和 检索 数据 。 最 低 有 效 字 节 存放 在 分 配给 该 数据 的 第 一 0001: | 56 | 
个 内 存 地 址 中 ,剩余 字 节 存放 在 随后 的 连续 内 存 位 置 中 。 考 0002: 
虑 一 个 双 字 12345678h。 如 果 将 其 存放 在 偏 移 量 为 0000 的 位 0003: 


置 ， 则 78h 存放 在 第 一 个 字 节 ，56h 存放 在 第 二 个 字 节 ,余下 图 3-14 12345678h 的 小 端 表示 
的 字 节 存放 地 址 偏 移 量 为 0002 和 0003 ， 如 图 3-14 所 示 。 


其 他 有 些 计算 机 系统 采用 的 是 大 端 顺序 (高 到 低 )。 可 
图 3-15 展示 了 12345678h 从 偏 移 量 0000 开始 的 大 端 顺序 存放 。 a 配对 
3.4.12 ”声明 未 初始 化 数据 0003: 


.DATA ? 伪 指 令 声明 未 初始 化 数据 。 当 定义 大 量 未 初始 、 四 1 12345678b 的 大 济 表 不 
化 数据 时 ，.DATA ? 伪 指令 减少 了 编译 程序 的 大 小 。 例 如 ， 下 述 代码 是 有 效 声明 


.data 

smallArray DWORD 10 DUP(0) ;40 个 字 节 

.data? 

bigArray DWORD 5000 DUP(?) ;20 000 个 字 节 ,未 初始 化 


而 另 一 方面 ， 下 述 代码 生成 的 编译 程序 将 会 多 出 20 000 个 字 节 : 
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2 DWORD 10 DUP(0) ;40 个 字 节 

bigArray DWORD 5000 DUP(?) ;20 000 个 字 节 

代码 与 数据 混合 ”汇编 器 允许 在 程序 中 进行 代码 和 数据 的 来 回 切换 。 比 如 ， 想 要 声明 一 
个 变量 ， 使 其 只 能 在 程序 的 局 部 区 域 中 使 用 。 下 述 示例 在 两 个 代码 语句 之 间 插 人 了 一 -个 名 为 
temp 的 变量 : 

.Code 

mov eax,ebx 

.data 

temp DWORD ? 


.Code 
mov temp,eax 


尽管 temp 声明 的 出 现 打 断 了 可 执行 指令 流 ， MASM 还 是 会 把 temp 放 在 数据 段 中 ， 并 与 
保持 编译 的 代码 段 分 隔 开 。 然 而 同时 ， 混 用 .code 和 .data 伪 指 令 会 使 得 程序 变 得 难以 阅读 。 


3.4.13 ”本 节 回 顾 


1. 为 一 个 16 位 有 符号 整数 创建 未 初始 化 数据 声明 。 
2. 为 一 个 8 位 无 符号 整数 创建 未 初始 化 数据 声明 。 
3. 为 一 个 8 位 有 符号 整数 创建 未 初始 化 数据 声明 。 
4. 为 一 个 64 位 整数 创建 未 初始 化 数据 声明 。 

5. 哪 种 数据 类 型 能 容纳 32 位 有 符号 整数 ? 


3.5 ”符号 常量 


通过 为 整数 表达 式 或 文本 指定 标识 符 来 创建 符号 常量 (symbolic constant) (也 称 符号 定 
义 ( symbolic definition ) ) 。 符 号 不 预 留存 储 空 间 。 它 们 只 在 汇编 器 扫描 程序 时 使 用 ， 并 且 在 
运行 时 不 会 改变 。 下 表 总 结 了 符号 与 变量 之 间 的 不 同 : 


Es 变量 
使 用 内 存 吗 ? BE 是 
运行 时 数值 会 改变 吗 ? 是 


本 节 将 展示 如 何 用 等 号 伪 指 令 (=) 创建 符号 来 表示 整数 表达 式 ， 还 将 使 用 EQU 和 
TESTEQU 伪 指 令 创 建 符号 来 表示 任意 文本 。 
3.5.1 等 号 伪 指 令 


等 号 伪 指 令 (equal-sign directive) 把 一 个 符号 名 称 与 一 个 整数 表达 式 连 接 起 来 (参见 
3.1.3 节 )， 其 语法 如 下 : 


name = expression 


通常 ， 表 达 式 是 一 个 32 位 的 整数 值 。 当 程序 进行 汇编 时 ， 在 汇编 器 预 处 理 阶段 ， 所 有 
出 现 的 name 都 会 被 替换 为 expression。 假 设 下 面 的 语句 出 现在 一 个 源 代码 文件 开始 的 位 置 : 


COUNT = 500 


然后 ， 假 设 在 其 后 10 行 的 位 置 有 如 下 语句 : 


64 务 了 章 


mov eax，COUNT 

那么 ， 当 汇编 文件 时 ，MASM 将 扫描 这 个 源 文 件 ， 并 生成 相应 的 代码 行 : 

mov eax, 500 

为 什么 使 用 符号 ? 程序 员 可 以 完全 跳 过 COUNT 符号 ， 简 化 为 直接 用 常量 500 来 编 
写 MOV 指令 ,但 是 经 验 表明 ， 如 果 使 用 符号 将 会 让 程序 更 加 容易 阅读 和 维护 。 设 想 ， 如 果 


COUNT 在 整个 程序 中 出 现 多 次 ,那么 ， 在 之 后 的 时 间 里 ,程序 员 就 能 方便 地 重新 定义 它 
的 值 : 


COUNT = 600 


假如 再 次 对 该 源 文件 进行 汇编 ， 则 所 有 的 COUNT 都 将 会 被 自动 替换 为 600。 
当前 地 址 计数 器 ”最 重要 的 符号 之 一 被 称 为 当前 地 址 计数 器 ( current location counter)， 
表示 为 $。 例 如 ， 下 面 的 语句 声明 了 一 个 变量 selfPtr， 并 将 其 初始 化 为 该 变量 的 偏 移 量 : 


selfPtr DWORD $ 
键盘 定义 ”程序 通常 定义 符号 来 识别 常用 的 数字 键盘 代码 。 比 如 , 27 是 Esc 键 的 ASCII 码 : 


Esc_key = 27 


在 该 程序 的 后 面 ， 如 果 语 名 使 用 这 个 符号 而 不 是 整数 常量 ,那么 它 会 具有 更 强 的 自 描述 
性 。 使 用 


mov al,Esc_key ; 好 的 编程 风格 
而 非 
mov al,27 ; 不 好 的 编程 风格 


使 用 DUP 操作 符 ”3.4.4 节 说 明了 怎样 使 用 DUP 操作 符 来 存储 数组 和 字符 串 。 为 
了 简化 程序 的 维护 ，DUP 使 用 的 计数 器 应 该 是 符号 计数 器 。 在 下 例 中 ， 如 果 已 经 定义 了 
COUNT,， 那么 它 就 可 以 用 于 下 面 的 数据 定义 中 : 


array dword COUNT DUP(0) 


重 定义 用 = 定义 的 符号 ， 在 同一 程序 内 可 以 被 重新 定义 。 下 例 展示 了 当 COUNT 改变 
数值 后 ， 汇 编 器 如 何 计算 它 的 值 : 


COUNT = 5 

mov al,COUNT ;AL=5 
COUNT = 10 

mov al,COUNT ; AL = 10 
COUNT = 100 

mov al,COUNT ; AL = 100 


符号 值 的 改变 ,例如 COUNT ， 不 会 影响 语句 在 运行 时 的 执行 顺序 。 相 反 ， 在 汇编 器 预 
处 理 阶段 ， 符 号 会 根据 汇编 器 对 源 代码 处 理 的 顺序 来 改变 数值 。 


3.5.2 ”计算 数组 和 字符 串 的 大 小 
在 使 用 数组 时 ， 通 常会 想 要 知道 它 的 大 小 。 下 例 使 用 常量 ListSize 来 声明 list 的 大 小 : 


汇编 语 语 基础 65 





list BYTE 10,20,30,40 

ListSize = 4 

显 式 声明 数组 的 大 小 会 导致 编程 错误 ， 尤 其 是 如 果 后 续 还 会 插入 或 删除 数组 元 素 。 声 
明 数 组 大 小 更 好 的 方法 是 ， 让 汇编 器 来 计算 这 个 值 。$ 运算 符 (当前 地 址 计数 器 ) 返回 当 
前 程序 语句 的 偏 移 量 。 在 下 例 中 ， 从 当前 地 址 计数 器 ($) 中 减 去 list 的 偏 移 量 ， 计 算得 到 
ListSize: 

list BYTE 10,20,30,40 

ListSize = ($ ~- 1ist) 

ListSize 必须 紧 跟 在 list 的 后 面 。 下 面 的 例子 中 ， 计 算得 到 的 ListSize 值 (24 ) 就 过 大 ， 
原因 是 var2 使 用 的 存储 空间 ， 影 响 了 当前 地 址 计数 器 与 list 偏 移 量 之 间 的 距离 : 

list BYTE 10,20,30,40 

var2 BYTE 20 DUP(?) 

ListSize = ($ - list) 


不 要 手动 计算 字符 串 的 长 度 ， 让 汇编 器 完成 这 个 工作 : 
myString BYTE "This is a long string, containing" 
BYTE "any number of characters" 

myString_len = ($ - myString) 

字数 组 和 双 字 数组 ” 当 要 计算 元 素数 量 的 数组 中 包含 的 不 是 字 节 时 ， 就 应 该 用 数组 总 的 
大 小 ( 按 字 节 计 ) 除 以 单个 元 素 的 大 小 。 比 如 ， 在 下 例 中 ， 由 于 数组 中 的 每 个 字 要 占 2 个 字 
节 (16 位)， 因 此 ， 地 址 范围 应 该 除 以 2: 

list WORD 1000h,2000h,3000h,4000h 

ListSize = ($ - List) / 2 

同样 ， 双 字数 组 中 每 个 元 素 长 4 个 字 节 ， 因 此 ， 其 总 长 度 除 以 4 才能 产生 数组 元 素 的 
个 数 : 


list DWORD 10000000h,20000000h,30000000h,40000000h 
ListSize = ($ -list) / 4 


3.5.3 ”EQU 伪 指 令 
EQU 伪 指 令 把 一 个 符号 名 称 与 一 个 整数 表达 式 或 一 个 任意 文本 连接 起 来 ， 它 有 3 种 格式 : 


name EQU expression 

name EQU symbol 

name EQU <text> 

第 一 种 格式 中 ，expression 必须 是 一 个 有 效 整数 表达 式 (参见 3.1.3 )。 第 二 种 格式 中 ， 
symbol 是 一 个 已 存在 的 符号 名 称 ， 已 经 用 = 或 EQU 定义 过 了 。 第 三 种 格式 中 ,任何 文本 都 
可 以 出 现在 <…> 内 。 当 汇编 器 在 程序 后 面 遇 到 name 时 ， 它 就 用 整数 值 或 文本 来 代替 符号 。 

在 定义 非 整数 值 时 ，EQU 非常 有 用 。 比 如 ， 可 以 使 用 EQU 定义 实数 常量 : 


PI EQU <3.1416> 


示例 下 面 的 例子 将 一 个 符号 与 一 个 字符 串 连接 起 来 ， 然 后 用 该 符号 定义 一 个 变量 : 


pressKey EQU <"Press any key to continue...",0> 
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.data 
prompt BYTE pressKey 


示例 ”假设 想 定义 一 个 符号 来 计算 一 个 10 x 10 整数 矩阵 的 元 素 个 数 。 现 在 用 两 种 不 同 的 
方法 来 进行 符号 定义 ， 一 种 用 整数 表达 式 ， 一 种 用 文本 。 然 后 把 两 个 符号 都 用 于 数据 定义 : 

matrixl EQU 30 二 

matrix2 EQU <10 * 10> 

.data 

M1 WORD matrixl 

M2 WORD matrix2 

汇编 器 将 为 M1 和 M2 生成 不 同 的 数据 定义 。 计 算 matrixl 中 的 整数 表达 式 ， 并 将 其 赋 
给 M1。 而 matrix2 中 的 文本 则 直接 复制 到 M2 的 数据 定义 中 : 

Ml WORD 100 

M2 WORD 10 * 10 

不 能 重 定义 与 = 伪 指 令 不 同 ,在 同一 源 代码 文件 中 ,用 EQU 定义 的 符号 不 能 被 重新 
定义 。 这 个 限制 可 以 防止 现 有 符号 在 无 意 中 被 赋予 新 值 。 


3.5.4 TEXTEQU 伪 指令 


TEXTEQU 伪 指 令 ， 类 似 于 EQU, 创建 了 文本 宏 (text macro)。 它 有 3 种 格式 : 第 一 种 
为 名 称 分 配 的 是 文本 ; 第 二 种 分 配 的 是 已 有 文本 宏 的 内 容 ; 第 三 种 分 配 的 是 整数 常量 表达 式 : 


name TEXTEQU <text> 
name TEXTEQU textmacro 
name TEXTEQU $%constExpr 


例如 ， 变 量 promptl 使 用 了 文本 宏 continueMsg: 
continueMsg TEXTEQU <"Do you wish to continue (Y/N)?"> 
.data 

promptl BYTE continueMsg 


文本 宏 可 以 相互 构建 。 如 下 例 所 示 ，count 被 赋值 了 一 个 整数 表达 式 ， 其 中 包含 rowSize。 
然后 ， 符 号 move 被 定义 为 mov。 最 后 ， 用 move 和 count 创建 setupAL: 


rowSize = 5 

count TEXTEQU %(rowSize * 2) 

move TEXTEQU <mov> 

setupAL TEXTEQU <move al,count> 

因此 ,语句 

setupAL 
就 会 被 汇编 为 

mov al,10 

用 TEXTEQU 定义 的 符号 随时 可 以 被 重新 定义 。 
3.5.5 ”本 节 回 顾 


1. 用 等 号 伪 指令 定义 一 个 符号 常量 ， 使 其 包含 Backspace 键 的 ASCII 码 (08h)。 
2. 用 等 号 伪 指 令 定义 符号 常量 SecondsInDay， 并 为 其 分 配 一 个 算术 表达 式 计算 24 小 时 包含 
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的 秒 数 。 
. 编写 一 条 语句 使 汇编 器 计算 下 列 数组 的 字 节 数 ， 并 将 结果 赋 给 符号 常量 ArraySize: 
myArray WORD 20 DUP(?) 
4. 说 明 如 何 计算 下 列 数组 的 元 素 个 数 ， 并 将 结果 赋 给 符号 常量 ArraySize: 
myArray DWORD 30 DUP(?) 


. 使 用 TEXTEQU 表达 式 将 “proc” 重 定义 为 “procedure”。 

. 使 用 TEXTEQU 将 一 个 字符 串 常 量 定义 为 符号 Sample， 再 使 用 该 符号 定义 字符 串 变 量 
MyString。 

. 使 用 TEXTEQU 将 下 面 的 代码 行 赋 给 符号 SetupESI: 


mov esi,OFFSET myArray 


LULD 


OO 


一 


3.6 ”64 位 编程 


AMD 和 Itel 64 位 处 理 器 的 出 现 增 加 了 对 64 位 编程 的 兴趣 。MASM 支持 64 位 代码 ， 
所 有 的 Visual Studio 2012 版 本 (最 终 版 、 高 级 版 和 专业 版 ) 以 及 桌面 系统 的 Visual Studio 
2012 Express 都 会 同步 安装 64 位 版 本 的 汇编 器 。 从 本 章 开 始 ， 之 后 的 每 一 章 都 将 给 出 一 些 
示例 程序 的 64 位 版 本 。 同 时 ， 还 会 讨论 本 书 提供 的 Irvine64 子 程 序 库 。 

现在 借助 本 章 之 前 给 出 的 AddTwoSum 程序 ， 将 其 改 为 64 位 编程 : 


; AddTwoSum_64.asm - 第 3 章 示例 


1 

2 

3; ExitProcess PROTO 
4: 

5 sata 

6: sum DWORD 0 

各 
8 


; .Code 


9: main PROC 

10% mov eax,5 

1s add eax,6 

2 mov sum,eax 

13s 

14: mov ecx,0 

15s call ExitProcess 
16: main ENDP 

17: END 


上 述 程序 与 本 章 之 前 给 出 的 32 位 版 本 不 同 之 处 如 下 所 示 : 
e@ 32 位 AddTwoSum 程序 中 使 用 了 下 列 三 行 代码 ， 而 64 位 版 本 中 则 没有 : 


.386 
.model flat,stdcall 
.stack 4096 


e@ 64 位 程序 中 ,使 用 PROTO 关键 字 的 语句 不 带 参 数 ， 如 第 3 行 代 码 所 示 : 


ExitProcess PROTO 


32 位 版 本 代码 如 下 : 
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ExitProcess PROTO, dwExitCode:DWORD 


e 14 一 15 行 使 用 了 两 条 指令 ( mov 和 call) 来 结束 程序 。32 位 版 本 则 只 使 用 了 一 条 
INVOKE 语句 实现 同样 的 功能 。64 位 MASM 不 支持 INVOKE 伪 指 令 。 

e 在 第 17 行 ，END 伪 指 令 没 有 指定 程序 人 口 点 ， 而 32 位 程序 则 指定 了 。 

使 用 64 位 寄存 器 

在 某 些 应 用 中 ， 可 能 需要 实现 超过 32 位 的 整数 的 算术 运算 。 在 这 种 情况 下 ， 可 以 使 用 
64 位 寄存 器 和 变量 。 例 如 ， 下 述 步骤 让 示例 程序 能 使 用 64 位 数值 : 

e 在 第 6 行 ， 定 义 sum 变量 时 ， 把 DWORD 修改 为 QWORD。 

e 在 10 一 12 行 ,把 EAX 替换 为 其 64 位 版 本 RAX。 

下 面 是 修改 后 的 6 一 12 行 : 


6: Sum QNORD 0 


8: .code 


9: main PROC 

0: mov rax,5s 
11s add rax,6 
二 mov sum,rax 


编写 32 位 还 是 64 位 汇编 程序 ， 很 大 程度 上 是 个 人 喜好 的 问题 。 但 是 ， 需 要 记 住 : 64 
位 MASM 11.0 (Visual Studio 2012 附带 的 ) 不 支持 INVOKE 伪 指 令 。 同 时 ， 为 了 运行 64 位 
程序 ， 必 须 使 用 64 位 Windows。 

本 书 作者 网 站 (asmirvine.com) 上 提供 了 说 明 ， 帮 助 在 64 位 编程 时 配置 Visual Studio。 


3.7 本章 小 结 


整 型 常量 表达 式 是 算术 表达 式 ， 包 括 了 整数 常量 、 符 号 常量 和 算术 运算 符 。 优 先 级 是 指 
当 表 达 式 有 两 个 或 更 多 运算 符 时 ， 运 算 符 的 隐 含 顺序 。 

字符 常量 是 用 引号 括 起 来 的 单个 字符 。 汇 编 器 把 字符 转换 为 一 个 字 节 ， 其 中 包含 的 是 该 
字符 的 二 进 制 ASCI 码 。 字 符 串 常量 是 用 引号 括 起 来 的 字符 序列 ， 可 以 选择 用 空 字 节 标记 
结束 。 

汇编 语言 有 一 组 保留 字 ， 它 们 含义 特殊 且 只 能 用 于 正确 的 上 下 文中 。 标 识 符 是 程序 员 选 
择 的 名 称 ， 用 于 标识 变量 、 符 号 常量 、 子 程序 和 代码 标号 。 不 能 用 保留 字 作 标识 符 。 

伪 指 令 是 嵌 在 源 代 码 中 的 命令 ， 由 汇编 器 进行 转换 。 指 令 是 源 代 码 语句 ， 由 处 理 器 在 运 
行 时 执行 。 指 令 助 记 符 是 短 关键 字 ， 用 于 标识 指令 执行 的 操作 。 标 号 是 一 种 标识 符 ， 用 作 指 
令 或 数据 的 位 置 标记 。 

操作 数 是 传递 给 指令 的 数据 。 一 条 汇编 指令 有 0 ~ 3 个 操作 数 ， 每 一 个 都 可 以 是 寄存 
器 、 内 存 操作 数 、 整 数 表达 式 或 输入 /输出 端口 号 。 

程序 包括 了 逻辑 段 ， 名 称 分 别 为 代码 段 、 数 据 段 和 堆栈 段 。 代 码 段 包含 了 可 执行 指令 ; 
堆栈 段 包 含 了 子 程序 参数 、 局 部 变量 和 返回 地 址 ; 数据 段 包含 了 变量 。 

源 文件 包含 了 汇编 语言 语句 。 列 表 文 件 包 含 了 程序 源 代 码 的 副本 ， 再 加 上 行 号 、 偏 移 地 
址 、 翻 译 的 机 器 代码 和 符号 表 ， 适合 打 印 。 源 文件 用 文本 编辑 器 创建 。 汇 编 器 是 一 种 程序 ， 
它 读 取 源 文件 ， 并 生成 目标 文件 和 列表 文件 。 链 接 器 也 是 一 种 程序 ， 它 读 取 一 个 或 多 个 目标 
文件 ， 并 生成 可 执行 文件 。 后 者 由 操作 系统 加 载 器 来 执行 。 
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MASM 识别 内 部 数据 类 型 ， 每 一 种 类 型 都 描述 了 一 组 数值 ， 这 些 数值 能 分 配给 指定 类 
型 的 变量 和 表达 式 : 

e BYTE 和 SBYTE 定义 8 位 变量 。 

e WORD 和 SWORD 定义 16 位 变量 。 

e DWORD 和 SDWORD 定义 32 位 变量 。 

e QWORD 和 TBYTE 分 别 定义 8 字 节 和 10 字 节 变量 。 

e REAL4、REAL8 和 REAL10 分 别 定义 4 字 节 、8 字 节 和 10 字 节 实数 变量 。 

数据 定义 语句 为 变量 预 留 内 存 空间 ， 并 可 以 选择 性 地 给 变量 分 配 一 个 名 称 。 如 果 一 个 数 
据 定义 有 多 个 初始 值 ， 那 么 它 的 标号 仅 指 向 第 一 个 初始 值 的 偏 移 量 。 创 建 字符 串 数据 定义 
时 ， 要 用 引号 把 字符 序列 括 起 来 。DUP 运算 符 用 常量 表达 式 作为 计数 器 ， 生 成 重复 的 存储 
分 配 。 当 前 地 址 计数 器 运算 符 〈$) 用 于 地 址 计算 表达 式 。 

x86 处 理 器 用 小 端 顺序 在 内 存 中 存 取 数 据 : 变量 的 最 低 有 效 字 节 存 储 在 其 起 始 (最 低 ) 
地 址 中 。 

符号 常量 (或 符号 定义 ) 把 标识 符 与 一 个 整数 或 文本 表达 式 连 接 起 来 。 有 3 个 伪 指令 能 
够 定义 符号 常量 : 

e 等 号 伪 指令 (=) 连接 符号 名 称 与 整数 常量 表达 式 。 

e。 EQU 和 TESTEQU 伪 指 令 连 接 符号 名 称 与 整数 常量 表达 式 或 一 些 任意 的 文本 。 


3.8 ”关键 术语 


3.8.1 术语 
assembler (汇编 器 ) instruction mnemonic (指令 助 记 符 ) 
big endian (大 端 ) integer constant ( 整 型 常数 ) 
binary codeddecimal(BCD) (二 进 制 编码 的 十 进 制 integer literal (整数 常量 ) 

数 ) intrinsic data type (内 部 数据 类 型 ) 
calling convention (调用 规范 ) label (标号 ) 
character literal (字符 常量 ) linker (链接 器 ) 
code label (代码 标号 ) link library (链接 库 ) 
code segment (代码 段 ) listing file (列表 文件 ) 
compiler (编译 器 ) little-endian order (小 端 顺 序 ) 
constant integer expression (整数 常量 表达 式 ) macro( 宏 ) 
data definition statement (数据 定义 语句 ) memory model (内 存 模型 ) 
data label (数据 标号 ) memory operand (内 存 操作 数 ) 
data segment (数据 段 ) object file (目标 文件 ) 
decimal real (十 进 制 实数 ) operand (操作 数 ) 
directive ( 伪 指 令 ) operator precedence (运算 符 优先 级 ) 
encoded real (实数 编码 ) packed binary coded decimal (压缩 二 进 制 编码 的 
executable file (可 执行 文件 ) 十 进 制 数 ) 
floating-point literal ( 浮 点 数 常量 ) process return code (进程 返回 代码 ) 
identifier (标识 符 ) program entry point (程序 人 口 点 ) 
initializer (初始 值 ) real number literal (实数 常量 ) 


instruction (指令 ) reserved word (保留 字 ) 
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source file( 源 文件 ) symbolic constant (符号 常量 ) 
stack segment (堆栈 段 ) system function (系统 函数 ) 
string literal (字符 串 常量 ) 


3.8.2 指令、 运算 符 和 伪 指令 


+ (加 法 ， 一 元 加 ) END 

= (赋值 ， 相 等 比较 ) ENDP 

/( 除 法 ) DUP 

* 〈 乘 法 ) EQU 

() (括号 ) MOD 

一 (减法 ， 一 元 减 ) MOV 
ADD NOP 
BYTE PROC 
CALL SBYTE 
.CODE SDWORD 
COMMENT .STACK 
.DATA TEXTEQU 
DWORD 


3.9 复习 题 和 练习 


3.9.1 简 答题 


1. 举例 说 明 三 种 不 同 的 指令 助 记 符 。 
2. 什么 是 调用 规范 ? 如 何在 汇编 语言 声明 中 使 用 它 ? 
3. 如 何在 程序 中 为 堆栈 预 留 空间 ? 
4. 说 明 为 什么 术语 汇编 器 语言 不 太 正确 。 
5. 说 明 大 端 序 和 小 端 序 之 间 的 区 别 ， 并 在 网 络 上 查找 这 些 术语 的 起 源 。 
6. 为 什么 在 代码 中 使 用 符号 常量 而 不 是 整数 常量 ? 
7. 源 文件 与 列表 文件 的 区 别 是 什么 ? 
8. 数据 标号 与 代码 标号 的 区 别 是 什么 ? 
9.( 真 / 假 ): 标识 符 不 能 以 数字 开头 。 
10.( 真 / 假 ): 十 六 进 制 常量 可 以 写 为 0x3A。 
11.( 真 / 假 ): 汇编 语言 伪 指 令 在 运行 时 执行 。 
12.( 真 / 假 ): 汇编 语言 伪 指令 可 以 写 为 大 写字 母 和 小 写字 母 的 任意 组 合 。 
13. 说 出 汇编 语言 指令 的 四 个 基本 组 成 部 分 。 
14.( 真 / 假 ): MOV 是 指令 助 记 符 的 例子 。 
15.( 真 / 假 ): 代码 标号 后 面 要 跟 冒 号 ( : )， 而 数据 标号 则 没有 。 
16. 给 出 块 注释 的 例子 。 
17. 使 用 数字 地 址 编写 指令 来 访问 变量 ， 为 什么 不 是 一 个 好 主意 ? 
18. 必须 向 ExitProcess 过 程 传递 什么 类 型 的 参数 ? 
19. 什么 伪 指 令 用 来 结束 子 程序 ? 
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20. 32 位 模式 下 ，END 伪 指 令 中 的 标识 符 有 什么 用 ? 

21. PROTO 伪 指 令 的 作用 是 什么 ? 

22.( 真 / 假 ): 目标 文件 由 链接 器 生成 。 

23.( 真 / 假 ): 列表 文件 由 汇编 器 生成 。 

24.( 真 / 假 ): 链接 库 只 有 在 生成 可 执行 文件 之 前 才 加 到 程序 中 。 
25. 哪个 数据 伪 指令 定义 32 位 有 符号 整数 变量 ? 

26. 哪个 数据 伪 指令 定义 16 位 有 符号 整数 变量 ? 

27. 哪个 数据 伪 指 令 定义 64 位 无 符号 整数 变量 ? 

28. 哪个 数据 伪 指令 定义 8 位 有 符号 整数 变量 ? 

29. 哪个 数据 伪 指 令 定义 10 字 节 压缩 BCD 变量 ? 


3.9.2 ”算法 基础 


1. 定义 4 个 符号 常量 分 别 表示 整数 25 的 十 进 制 形式 、 二 进 制 形式 、 八 进 制 形式 和 十 六 进 制 形式 。 

2. 通过 实验 和 错误 ， 找 出 一 个 程序 是 否 能 有 多 个 代码 段 和 数据 段 。 

3. 编写 数据 定义 ， 把 一 个 双 字 按 大 端 序 存 放 在 内 存 中 。 

4. 试 发 现 用 DWORD 类 型 定义 一 个 变量 时 ， 是 否 能 向 其 赋予 负数 值 。 这 说 明了 汇编 器 类 型 检查 的 什么 
问题 ? 

. 编写 一 个 程序 ， 包 含 两 条 指令 :( 1 ) EAX 寄存 器 加 5 ; (2) EDX 寄存 器 加 5。 生 成 列表 文件 并 检查 
由 汇编 器 生成 的 机 器 代码 。 发 现 这 两 条 指令 的 不 同 之 处 了 吗 ? 如 果 有 ， 是 什么 ? 

6. 假设 有 数值 456789ABh， 按 小 端 序列 出 其 字 节 内 容 。 

7. 声明 一 个 数组 ， 其 中 包含 120 个 未 初始 化 无 符号 双 字 数值 。 

8. 声明 一 个 字 节 数 组 ， 并 将 其 初始 化 为 字母 表 的 前 5 个 字母 。 

9. 声明 一 个 32 位 有 符号 整数 变量 ， 并 初始 化 为 尽 可 能 小 的 十 进 制 负数 。( 提 示 : 参阅 第 1 章 的 整数 范 
围 。) 

10. 声明 一 个 16 位 无 符号 整数 变量 wArray， 使 其 具有 3 个 初始 值 。 

11. 声明 一 个 字符 串 变量 ， 包 含 你 最 喜欢 颜色 的 名 字 ， 并 将 其 初始 化 为 空 字 节 结束 的 字符 串 。 

12. 声明 一 个 未 初始 化 数组 dArray， 包 含 50 个 有 符号 双 字 。 

13. 声明 一 个 字符 串 变 量 ， 包 含 单 词 “TEST” 并 重复 500 次 。 

14. 声明 一 个 数组 bArray， 包 含 20 个 无 符号 字 节 ， 并 将 其 所 有 元 素 都 初始 化 为 0。 

15. 写 出 下 述 双 字 变 量 在 内 存 中 的 字 节 序列 (从 最 低 字 节 到 最 高 字 节 ): 


vall DWORD 87654321h 


(An 


3.10 ”编程 练习 


* 1. 整数 表达 式 的 计算 
参考 3.2 节 的 程序 AddTwo， 编 写 程序 ， 利 用 寄存 器 计算 表达 式 : A= (A+B) - (C-D)。 整 数 
值 分 配给 寄存 器 EAX、EBX、ECX 和 EDX。 
*2. 符号 整数 常量 
编写 程序 ， 为 一 周 七 天 定义 符号 常量 。 创 建 一 个 数组 变量 ， 用 这 些 符号 常量 作为 其 初始 值 。 
xi* 3. 数据 定义 
编写 程序 ， 对 3.4 节 表 3-2 中 列 出 的 每 一 个 数据 类 型 进行 定义 ， 并 将 每 个 变量 都 初始 化 为 与 其 
类 型 一 致 的 数值 。 
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*4, 符号 文本 常量 
编写 程序 ， 定 义 几 个 字符 串 文本 (引号 之 间 的 字符 ) 的 符号 名 称 ， 并 将 每 个 符号 名 称 都 用 于 变 
量 定义 。 
**w* 与. AddTwoSum 的 列表 文件 
生成 AddTwoSum 程序 的 列表 文件 ， 为 每 条 指令 的 机 器 代码 字 节 编写 说 明 。 某 些 字 节 值 的 含义 
可 能 需要 猜测 。 
*k* 6. AddVariables 程序 


修改 AddVariables 程序 使 其 使 用 64 位 变量 。 描 述 汇 编 器 产生 的 语法 错误 ， 并 说 明 为 解决 这 些 
错误 采取 的 措施 。 
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数据 传送 、 寻 址 和 算术 运算 





本 章 介绍 了 数据 传送 和 算术 运算 的 若干 必要 指令 ， 用 大 量 的 篇 幅 说 明了 基本 寻 址 模式 ， 
如 直接 寻 址 、 立 即 寻 址 和 可 以 用 于 处 理 数 组 的 间接 寻 址 。 同 时 ， 还 展示 了 怎样 创建 循环 和 怎 
样 使 用 一 些 基 本 运算 符 ， 如 OFFSET，PTR 和 LENGTHOF。 阅 读本 章 后 ， 将 会 了 解除 条 件 
语句 之 外 的 汇编 语言 的 基本 工作 知识 。 


4.1 数据 传送 指令 





4.1.1 引言 


用 Java 或 C++ 这 样 的 语言 编程 时 ， 编 译 器 产生 的 大 量 语法 错误 信息 很 容易 让 初学 者 感 
到 心烦 。 编 译 器 执行 严格 类 型 检查 ， 以 避免 可 能 出 现 诸 如 不 匹配 变量 和 数据 的 错误 。 另 一 方 
面 ， 只 要 处 理 器 指令 集 允 许 ， 汇 编 器 就 能 完成 任何 操作 请 求 。 换 句 话 说， 汇编 语言 就 是 将 程 
序 员 的 注意 力 集中 在 数据 存储 和 具体 机 器 细节 上 。 编 写 汇编 语言 代码 时 ， 必 须要 了 解 处 理 器 
的 限制 。 而 x86 处 理 器 具有 众所周知 的 复杂 指令 集 ( complex instruction set)， 因 此 ， 可 以 用 
许多 方法 来 完成 任务 。 

如 果 花 时 间 深 入 了 解 本 章 介绍 的 材料 ， 则 阅读 本 书 其 他 内 容 会 更 加 顺利 。 随 着 示例 程序 
越 来 越 复杂 ， 需 要 依赖 对 本 章 介绍 的 基础 工具 的 掌握 。 


4.1.2 ”操作 数 类 型 
第 3 章 介 绍 过 x86 指令 格式 : 
[label:] memonic [operands][ ; comment ] 


指令 包含 的 操作 数 个 数 可 以 是 : 0 个 ，1 个 ,2 个 或 3 个 。 这 里 ,为 了 清晰 起 见 ， 省 略 
掉 标号 和 注释 : 


mnemonic 

mnemonic [destination] 

mnemonic [destination],[sourcel] 

memonic [destinationl, [source-1], [source-2] 


操作 数 有 3 种 基本 类 型 : 

e 立即 数 一 一 使 用 数字 文本 表达 式 

。 寄存 器 操作 数 一 一 使 用 CPU 内 已 命名 的 寄存 器 

e 内 存 操作 数 一 一 引用 内 存 位置 

表 4-1 说 明了 标准 操作 数 类 型 ， 它 使 用 了 简单 的 操作 数 符号 (32 位 模式 下 )， 这 些 符号 
来 自 Intel 手册 并 进行 了 改编 。 从 现在 开始 ， 本 书 将 用 这 些 符 号 来 描述 每 条 指令 的 语法 。 
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表 4-1 32 位 模式 下 指令 操作 数 符号 


操作 数 说 明 

reg8 8 位 通用 寄存 器 : AH、AL、 BH、 BL、 CH、 CL DH、 DL 
reg16 16 位 通用 寄存 器 : AX、BX、CX、DX、SI、 DI、SP、BP 
reg32 32 位 通用 寄存 器 : EAX、EBX、ECX、EDX、ESI、 EDI、 ESP、 EBP 
reg 通用 寄存 器 

sreg 16 位 段 寄存 器 : CS、DS、SS、ES、 FS、GS 

imm 8 位、16 位 或 32 位 立即 数 

immg 8 位 立即 数 ， 字 节 型 数值 

imml6 16 位 立即 数 ， 字 类 型 数值 

imm32 32 位 立即 数 ， 双 字 型 数值 

reg/memg 8 位 操作 数 ， 可 以 是 8 位 通用 寄存 器 或 内 存 字 节 
reghimem16 16 位 立即 数 ， 可 以 是 16 位 通用 寄存 器 或 内 存 字 
reg/mem32 32 位 立即 数 ， 可 以 是 32 位 通用 寄存 器 或 内 存 双 字 

mem 8 位 、16 位 或 32 位 内 存 操作 数 


4.1.3 直接 内 存 操作 数 


变量 名 引用 的 是 数据 段 内 的 偏 移 量 。 例 如 ， 如 下 变量 varl 的 声明 表示 ， 该 变量 的 大 小 
类 型 为 字 节 ， 值 为 十 六 进 制 的 10: 


.data 
varl BYTE 10h 


可 以 编写 指令 ， 通 过 内 存 操作 数 的 地 址 来 解析 (查找 ) 这 些 操作 数 。 假 设 varl 的 地 址 偏 
移 量 为 10400h。 如 下 指令 将 该 变量 的 值 复制 到 AL 寄存 器 中 : 


mov al varl 
指令 会 被 汇编 为 下 面 的 机 器 指令 : 
A0 00010400 


这 条 机 器 指令 的 第 一 个 字 节 是 操作 代码 〈 即 操作 码 (opcode)) 。 剩 余部 分 是 varl 的 32 
位 十 六 进 制 地 址 。 虽 然 编程 时 有 可 能 只 使 用 数字 地 址 ， 但 是 如 同 varl 一 样 的 符号 标号 会 让 
使 用 内 存 更 加 容易 。 


另 一 种 表示 法 。 一 些 程序 员 更 喜欢 使 用 下 面 这 种 直接 操作 数 的 表达 方式 ， 因 为 ， 括 
号 意味 着 解析 操作 : 


mov al, [var1] 


MASM 允许 这 种 表示 法 ， 因 此 只 要 愿意 就 可 以 在 程序 中 使 用 。 由 于 多 数 程序 (包括 


Microsoft 的 程序 ) 印刷 时 都 没有 用 括号 ， 所 以 ， 本 书 只 在 出 现 算术 表达 式 时 才 使 用 这 种 
带 括号 的 表示 法 : 


mov al, [varl + 5] 


(这 就 是 直接 偏 移 量 操 作 数 ， 将 在 4.1.8 节 中 作为 一 个 主题 进行 详细 讨论 。) 





履 据 信 送 、 录 丰 和 草 大 和 运 划 


4.1.4 MOV 指令 


MOYV 指令 将 源 操作 数 复制 到 目的 操作 数 。 作 为 数据 传送 ( data transfer) 指令 ， 它 几乎 


用 在 所 有 程序 中 。 在 它 的 基本 格式 中 ， 第 一 个 操作 数 是 目的 操作 数 ， 第 二 个 操作 数 是 源 操 
作 数 : 


MOV destination, source 


其 中 ， 目 的 操作 数 的 内 容 会 发 生 改 变 ， 而 源 操作 数 不 会 改变 。 这 种 数据 从 右 到 左 的 移动 


与 C++ 或 Java 中 的 赋值 语句 相似 : 


数 。 


dest = source; 


在 几乎 所 有 的 汇编 语言 指令 中 ， 左 边 的 操作 数 是 目标 操作 数 ， 而 右边 的 操作 数 是 源 操作 
只 要 按照 如 下 原则 ，MGOYV 指令 使 用 操作 数 是 非常 灵活 的 。 

e 两 个 操作 数 必须 是 同样 的 大 小 。 

e 两 个 操作 数 不 能 同时 为 内 存 操 作 数 。 

。 指令 指针 寄存 器 (IP、EIP 或 RIP) 不 能 作为 目标 操作 数 。 

下 面 是 MOYV 指令 的 标准 格式 : 


MOV reg,reg 
MOV mem, reg 
MOV reg,mem 
MOV mem, imm 
MOV reg,imm 


内 存 到 内 存 单条 MOYV 指令 不 能 用 于 直接 将 数据 从 一 个 内 存 位 置 传送 到 另 一 个 内 存 位 
相反 ， 在 将 源 操作 数 的 值 赋 给 内 存 操作 数 之 前 ， 必 须 先 将 该 数值 传送 给 一 个 寄存 器 : 


.data 

varl WORD ? 
var2 WORD ? 
.Code 

mov ax,varl 
mov var2,ax 


在 将 整 型 常数 复制 到 一 个 变量 或 寄存 器 时 ， 必 须 考虑 该 常量 需要 的 最 少 字 节 数 。 第 1 章 


的 表 1-4 给 出 了 无 符号 整 型 常数 的 大 小 ， 表 1-7 给 出 了 有 符号 整 型 常数 的 大 小 。 


覆盖 值 
下 述 代码 示例 演示 了 怎样 通过 使 用 不 同 大 小 的 数据 来 修改 同一 个 32 位 寄存 器 。 当 


oneWord 字 传 送 到 AX 时 ， 它 就 覆盖 了 AL 中 已 有 的 值 。 当 oneDword 传送 到 EAX 时 ， 它 就 
覆盖 了 AX 的 值 。 最 后 ， 当 0 被 传送 到 AX 时 ， 它 就 覆盖 了 EAX 的 低 半 部 分 。 


.data 
oneByte BYTE 78h 
oneWord WORD 1234h 


oneDword DWORD 12345678h 

.Code 

mov eax,0 ; EAX = 00000000h 
mov al,oneByte ; EAX = 00000078h 
mov ax,oneWord ; EAX = 00001234h 
mov eax,oneDword ; EAX = 12345678h 
mov ax,0 ; EAX = 12340000h 


[98 


[99 | 
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4.1.5 整数 的 全 零 / 符号 扩展 


1. 把 一 个 较 小 的 值 复制 到 一 个 较 大 的 操作 数 

尽管 MOV 指令 不 能 直接 将 较 小 的 操作 数 复制 到 较 大 的 操作 数 中 ,但 是 程序 员 可 以 想 办 
法 解决 这 个 问题 。 假 设 要 将 count (无 符号 ，16 位 ) 传送 到 ECX (32 位 )， 可 以 先 将 ECX 设 
置 为 0， 然 后 将 count 传送 到 CX: 


.data 

count WORD 1 
.code 

mov ecx, 0 
mov cx,count 


如 果 对 一 个 有 符号 整数 -16 进行 同样 的 操作 会 发 生 什么 呢 ? 


.data 

signedVal SWORD -16 ; FFFOh (-16) 

.Code 

mov ecx,0 

mov cx,signedVal ; ECX = O000FFFOh (+65,520) 


ECX 中 的 值 (+65 520 ) 与 -16 完全 不 同 。 但 是 ， 如 果 先 将 ECX 设置 为 FFFFFFFFh， 
然后 再 把 signedVal 复制 到 CX， 那 么 最 后 的 值 就 是 完全 正确 的 : 

mov ecx,OFFFFFFFFh 

mov cx,signedVval ; ECX = FFFFFFFOh (-16) 

本 例 的 有 效 结果 是 用 源 操作 数 的 最 高 位 (1 ) 来 填充 目的 操作 数 ECX 的 高 16 位 ， 这 
种 技术 称 为 符号 扩展 ( sign extension)。 当 然 ， 不 能 总 是 假设 源 操作 数 的 最 高 位 是 1。 幸 运 
的 是 ，Intel 的 工程 师 在 设计 指令 集 时 已 经 预见 到 了 这 个 问题 ， 因 此 ， 设 置 了 MOVZX 和 
MOVSX 指令 来 分 别处 理 无 符号 整数 和 有 符号 整数 。 

2. MOVZX 指令 

MOVZX 指令 (进行 全 零 扩展 并 传送 ) 将 源 操 作 数 复制 到 目的 操作 数 ， 并 把 目的 操作 数 
0 扩展 到 16 位 或 32 位。 这 条 指令 只 用 于 无 符号 整数 ， 有 三 种 不 同 的 形式 : 


MOVZX reg32,reg/mem8 
MOVZX reg32,reg/meml6 
MOVZX regl16,reg/mem8 


(操作 数 符号 含义 见 表 4-1。) 在 三 种 形式 中 ， 第 一 个 操作 数 (寄存 器 ) 是 目的 操作 数 ， 第 
二 个 操作 数 是 源 操作 数 。 注 意 ， 源 操作 数 不 能 是 常数 。 下 例 将 二 进 制 数 1000 1111 进行 全 零 


扩展 并 传送 到 AX: 
.data 
byteVal BYTE 10001111b 
-Code 
movzx ax,byteval ; AX = 0000000010001111b 
图 4-1 展示 了 如 何 将 源 操作 数 进行 全 零 扩 展 ， 并 送 入 16 位 目的 操作 数 。 
下 面 例子 的 操作 数 是 各 种 大 小 的 寄存 器 : 
mov bx, 0A69Bh 
movzx eax,bx ; EAX = 0000A69Bh 
movzx edx,bl ; EDX = 0000009Bh 


movzx Ccx,bl ; CX = 009Bh 
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000000010001111| 目的 
图 4-1 使 用 MOVZX 复制 一 个 字 节 到 16 位 目的 操作 数 
下 面 例 子 的 源 操作 数 是 内 存 操作 数 ， 执 行 结果 是 一 样 的 : 


.data 
bytel BYTE 9Bh 
wordl WORD 0A69Bh 


.Code 

movzx eax,wordl ; EAX = 0000A69Bh 
movzx edx,bytel ; EDX = 0000009Bh 
movzx cx,bytel ; CX = 009Bh 

3. MOVSX 指令 


MOVSX 指令 (进行 符号 扩展 并 传送 ) 将 源 操作 数 内 容 复制 到 目的 操作 数 ， 并 把 目的 操 
作 数 符号 扩展 到 16 位 或 32 位。 这 条 指令 只 用 于 有 符号 整数 ， 有 三 种 不 同 的 形式 : 


MOVSX reg32,reg/mem8 
MOVSX reg32,reg/meml6 
MOVSX regl16,reg/mem8 


操作 数 进行 符号 扩展 时 ， 在 目的 操作 数 的 全 部 扩展 位 上 重复 (复制 ) 长 度 较 小 操作 数 的 
最 高 位 。 下 面 的 例子 是 将 二 进 制 数 1000 1111b 进行 符号 扩展 并 传送 到 AX: 


.data 

byteVal BYTE 10001111b 

.Code 

movsx ax,byteVal ; AX = 1111111110001111b 


如 图 4-2 所 示 ， 复 制 最 低 8 位 ， 同 时， 将 源 操作 数 的 最 高 位 复制 到 目的 操作 数 高 8 位 的 
每 一 位 上 。 

如 果 一 个 十 六 进 制 常 数 的 最 大 有 效 数 字 大 于 7， 那么 它 的 最 高 位 等 于 1。 如 下 例 所 示 ， 
传送 到 BX 的 十 六 进 制 数值 为 A69B， 因 此 ,数字 “和 A” 就 意味 着 最 高 位 是 1。( A69B 前 面 
的 0 是 一 种 方便 的 表示 法 ， 用 于 防止 汇编 器 将 常数 误 认 为 标识 符 。) 


mov bx, OA69Bh 

movsx eax,bx ; EAX = FFFFA69Bh 

movsx edx,bl ; EDX = FFFFFF9Bh 
= FF9Bh 


movsx Ccx,bl A 






(复制 8 位 ) 


or] 的 


图 4-2 使 用 MOVSX 将 一 个 字 节 复制 到 16 位 目的 操作 数 


4.1.6 LAHF 和 SAHF 指令 
LAHF (加 载 状态 标志 位 到 AH) 指令 将 EFLAGS 寄存 器 的 低 字 节 复 制 到 AH。 被 复制 的 
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标志 位 包括 : 符号 标志 位 、 零 标志 位 、 辅 助 进位 标志 位 、 奇 偶 标 志 位 和 进位 标志 位 。 使 用 这 
条 指令 ， 可 以 方便 地 把 标志 位 副本 保管 在 变量 中 : 

.data 

1 BYTE ? 

.code 

lahf ; 将 标志 位 加 载 到 AH 

mov saveflags,ah  ; 用 变量 保存 这 些 标志 位 

SAHF (保存 AH 内 容 到 状态 标志 位 ) 指令 将 AH 内 容 复 制 到 EFLAGS (或 RFLAGS) 寄 
存 器 低 字 节 。 例 如 ， 可 以 检索 之 前 保存 到 变量 中 的 标志 位 数值 : 


mov ah,saveflags ，; 加 载 被 保存 标志 位 到 AH 
sahf ; 复制 到 FLAGS 寄存 器 


4.1.7 XCHG 指令 
XCHG (交换 数据 ) 指令 交换 两 个 操作 数 内 容 。 该 指令 有 三 种 形式 : 


XCHG reg,reg 
XCHG reg,mem 
XCHG mem,reg 


除了 XCHG 指令 不 使 用 立即 数 作 操作 数 之 外 ，XCHG 指令 操作 数 的 要 求 与 MOV 指令 
操作 数 要 求 (参见 4.1.4 节 ) 是 一 样 的 。 在 数组 排序 应 用 中 ，XCHG 指令 提供 了 一 种 简单 的 
方法 来 交换 两 个 数组 元 素 。 下 面 是 几 个 使 用 XCHG 指令 的 例子 。 


xchg ax,bx ; 交换 16 位 寄存 器 内 容 

xchg ah,al ; 交换 8 位 寄存 器 内 容 

xchg varl,bx ;交换 16 位 内 存 操作 数 与 BX 寡 存 器 内 容 

Xxchg eax,ebx  ; 交换 32 位 寄存 器 内 容 

如 果 要 交换 两 个 内 存 操 作 数 ， 则 用 寄存 器 作为 临时 容 嚣 ， 把 MOYV 指令 与 XCHG 指令 
一 起 使 用 : 


mov ax,vall 
xchg ax,val2 
mov vall,ax 


4.1.8 ”直接 一 偏 移 量 操作 数 


变量 名 加 上 一 个 位 移 就 形成 了 一 个 直接 - 偏 移 量 操作 数 。 这 样 可 以 访问 那些 没有 显 式 标 
记 的 内 存 位 置 。 假 设 现 有 一 个 字 节 数组 arrayB: 


arrayB BYTE 10h,20h,30h,40h,50h 


用 该 数组 作为 MOYV 指令 的 源 操作 数 ， 则 自动 传送 数组 的 第 一 个 字 节 : 


mov al,arrayB ; AL = 10k 
通过 在 arrayB 偏 移 量 上 加 1 就 可 以 访问 该 数组 的 第 二 个 字 节 : 
mov al, [arrayB+1] ; AL = 20h 


如 果 加 2 就 可 以 访问 该 数组 的 第 三 个 字 节 : 


mov al, [arrayB+2] ; AL = 30h 
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形 如 arrayB+1 一 样 的 表达 式 通过 在 变量 偏 移 量 上 加 常数 来 形成 所 谓 的 有 效 地 址 。 有 效 
地 址 外 面 的 括号 表明 ， 通 过 解析 这 个 表达 式 就 可 以 得 到 该 内 存 地 址 指示 的 内 容 。 汇 编 器 并 不 
要 求 在 地 址 表达 式 之 外 加 括号 ， 但 为 了 清晰 明了 ， 本 书 还 是 强烈 建议 使 用 括号 。 

MASM 没有 内 置 的 有 效 地 址 范围 检查 。 在 下 面 的 例子 中 ， 假 设 数组 arrayB 有 5 个 字 节 ， 
而 指令 访问 的 是 该 数组 范围 之 外 的 一 个 内 存 字 节 。 其 结果 是 一 种 难以 发 现 的 逻辑 错误 ， 因 
此 ， 在 检查 数组 引用 时 要 非常 小 心 : 


mov al, [arrayB+20] 7 102 


字 和 双 字 数组 ”在 16 位 的 字数 组 中 ， 每 个 数组 元 素 的 偏 移 量 比 前 一 个 多 2 个 字 节 。 这 
就 是 为 什么 在 下 面 的 例子 中 ， 数 组 ArrayW 加 2 才能 指向 该 数组 的 第 二 个 元 素 : 


.data 

arrayW WORD 100h,200h,300h 

.Code 

mov ax,arrayW ; MX = 100h 
mov ax, [arrayW+2] ; AX = 200h 
同样 ， 如 果 是 双 字 数组 ， 则 第 一 个 元 素 偏 移 量 加 4 才能 指向 第 二 个 元 素 : 
.data 

arrayD DWORD 10000h,20000h 

.code 

mov eax,arrayD ; EAX = 10000h 
mov eax, [arrayD+4] ; EAX = 20000h 


4.1.9 示例 程序 (Moves ) 


该 程序 中 包含 了 本 章 迄 今 介绍 的 所 有 指令 ， 包 括 : MOV、XCHG、MOVSX 和 MOVZX， 
展示 了 字 节 、 字 和 双 字 是 如 何 受到 它们 的 影响 。 同 时 ， 程 序 中 还 包括 了 一 些 直 接 - 偏 移 量 操 
作 数 。 


7 数据 传送 示例 (Moves .asm) 

.386 

.model flat,stdcall 

.Stack 4096 

ExitProcess PROTO,dwExitCode:DWORD 
.data 


vall WORD 1000h 

val2 WORD 2000h 

arrayB BYTE 10h,20h,30h,40h,50h 
arrayW WORD 100h,200h,300h 
arrayD DWORD 10000h,20000h 


.Code 
main PROC 
7 演示 MOVZX 指令 
mov bx,0A69Bh 


IOVZX eax, bx ; EAX = 0000A69Bh 
movzx edx,bl ; EDX = 0000009Bh 
movzx cx,bl ; CX = 009Bh 

; 演示 MOVSX 指令 
mov bx,0A69Bh 
movsx eax, bx ; EAX = FFFFA69Bh 


movsx edx,bl ; EDX = FFFFFF9Bh 
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mov bl,7Bh 


movsx cx,bl ; CX = 007Bh 
?内存 - 内 存 的 交换 

mov ax,vall ; RMX = 1000h 

xchg ax,val2 ; AX=2000h, val2=1000h 

mov vall,ax ; Vvall = 2000h 


;直接 - 偏 移 量 寻 址 ( 字 节 数组 ) 


mov al,arrayB ; AL = 10h 
mov al, [arrayB+1] ; AL = 20h 
mov al, [arrayB+2] ; AL = 30h 

; 直接 - 偏 移 量 寻 址 ( 字数 组 ) 
mov ax,arrayW ? = 100h 
mov ax, [arrayW+2] ; AX = 200h 

; 直接 - 偏 移 量 寻 址 ( 双 字 数组 ) 
mov eax,arrayD ; EAX = 10000h 
mov eax, [arrayD+4] ; EAX = 20000h 
mov eax, [arrayD+4] ; EAX = 20000h 


INVOKE ExitProcess,0 
main ENDP 
END main 


该 程序 不 会 产生 屏幕 输出 ,但 是 可 以 用 调试 器 (debugger) 运行 。 

在 Visual Studio 调试 器 中 显示 CPU 标志 位 

在 调试 期 间 显示 CPU 状态 标志 位 时 ， 在 Debug 菜单 中 选择 Windows 子 菜单 ， 再 选择 
Register。 在 Register 窗口 ， 右 键 选择 下 拉 列 表 中 的 Flags。 要 想 查看 这 些 菜 单 选 项 ， 必 须 调 
试 程序 。 下 表 是 Register 窗口 中 用 到 的 标志 位 符号 : 


标志 名 称 | 溢出 | 方向 | 中 断 | 符号 | 零 | 辅助 进位 | 奇偶 | 
UP L AC 





vv | | me | | A | 
每 个 标志 位 有 两 个 值 : 0 (清除 ) 或 1 ( 置 位 )。 示 例如 下 : 





调试 程序 期 间 ， 当 逐步 执行 代码 时 ， 指 令 只 要 修改 了 标志 位 的 值 ， 则 标志 位 就 会 显示 为 
红色 。 这 样 就 可 以 通过 单 步 执行 来 了 解 指令 是 如 何 影响 标志 位 的 ， 并 可 以 密切 关注 这 些 标志 
位 值 的 变化 。 


4.1.10 本 节 回 顾 


1. 操作 数 的 三 种 基本 类 型 是 什么 ? 

2.( 真 / 假 ): MOV 指令 的 目的 操作 数 不 能 为 段 寄 存 器 。 
3.( 真 / 假 ): MOV 指令 中 的 第 二 个 操作 数 是 目的 操作 数 。 

4. ( 真 / 假 ): EIP 寄存 器 不 能 作为 MOV 指令 的 目的 操作 数 。 
5. Intel 使 用 的 操作 数 符号 中 ，reg/mem32 的 含义 是 什么 ? 

6. Intel 使 用 的 操作 数 符号 中 ，imm16 的 含义 是 什么 ? 
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4.2 ”加 法 和 减法 


算术 运算 是 汇编 语言 中 一 个 大 得 令 人 惊讶 的 主题 ! 本 节 重 点 在 于 加 法 和 减法 ， 乘 法 和 除 
法 将 在 第 7 章 讨 论 ， 浮 点 运算 将 在 第 12 章 讨 论 。 

先 从 最 简单 、 最 有 效 的 指令 开始 : INC (增加 ) 和 DEC (减少 ) 指令 ， 即 加 1 和 减 1。 然 
后 是 能 提供 更 多 操作 的 ADD、SUB 和 NEG ( 非 ) 指令 。 最 后 ， 将 讨论 算术 运算 指令 如 何 影 
响 CPU 状态 标志 位 (进位 位 、 符 号 位 、 零 标志 位 等 )。 请 记 住 ， 汇 编 语言 的 细节 很 重要 。 


4.2.1 INC 和 DEC 指令 


INC (增加 ) 和 DEC (减少 ) 指令 分 别 表 示 寄 存 器 或 内 存 操 作 数 加 1 和 减 1。 语 法 如 下 
所 示 : 

INC reg/mem 

DEC reg/mem 

下 面 是 一 些 例子 : 


.data 

myWord WORD 1000h 

.Code 

inc myWord ; myWord = 1001h 
mov bx,myWord 

dec bx ; BX = 1000h 


根据 目标 操作 数 的 值 ， 溢 出 标志 位 、 符 号 标志 位 、 零 标志 位 、 辅 助 进位 标志 位 、 进 位 标 
志 位 和 奇偶 标志 位 会 发 生变 化 。INC 和 DEC 指令 不 会 影响 进位 标志 位 (这 还 真 让 人 吃惊 )。 


4.2.2 ADD 指令 
ADD 指令 将 长 度 相 同 的 源 操作 数 和 目的 操作 数 进 行 相 加 操作 。 语 法 如 下 : 


ADD dest, Source 


在 操作 中 ， 源 操作 数 不 能 改变 ， 相 加 之 和 存放 在 目的 操作 数 中 。 该 指令 可 以 使 用 的 操作 
数 与 MOV 指令 相同 (参见 4.1.4 节 )。 下 面 是 两 个 32 位 整数 相 加 的 短 代 码 示 例 : 


.data 
varl DWORD 10000h 
var2 DWORD 20000h 


.code 
mov eax,varl ; EAX = 10000h 
add eax,var2 ; EAX = 30000h 


标志 位 ”进位 标志 位 、 零 标志 位 、 符 号 标志 位 、 溢 出 标志 位 、 辅 助 进位 标志 位 和 奇偶 标 
志 位 根据 存 人 目标 操作 数 的 数值 进行 变化 。4.2.6 节 将 介绍 标志 位 如 何 发 生 作用 。 


4.2.3 SUB 指令 


SUB 指令 从 目的 操作 数 中 减 去 源 操作 数 。 该 指令 对 操作 数 的 要 求 与 ADD 和 MOYV 指令 
相同 。 指 令 语法 如 下 : 


SUB dest, source 


下 面 是 两 个 32 位 整数 相 减 的 短 代码 示例 : 





js 
tn 
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.data 
varl DWORD 30000h 
var2 DWORD 10000h 


.Code 
mov eax,varl ; EAX = 30000h 
sub eax,var2 ; EAX = 20000h 


标志 位 ”进位 标志 位 、 零 标志 位 、 符 号 标志 位 、 溢 出 标志 位 、 辅 助 进位 标志 位 和 奇偶 标 
志 位 根据 存 人 目标 操作 数 的 数值 进行 变化 。 


4.2.4 NEG 指令 


NEG ( 非 ) 指令 通过 把 操作 数 转换 为 其 二 进 制 补 码 ， 将 操作 数 的 符号 取 反 。 下 述 操作 数 
可 以 用 于 该 指令 : 

NEG reg 

NEG mem 

(将 目标 操作 数 按 位 取 反 再 加 1， 就 可 以 得 到 这 个 数 的 二 进 制 补 码 。) 

标志 位 ”进位 标志 位 、 零 标志 位 、 符 号 标志 位 、 滋 出 标志 位 、 辅 助 进位 标志 位 和 奇偶 标 
志 位 根据 存 和 目标 操作 数 的 数值 进行 变化 。 


4.2.5 ”执行 算术 表达 式 


使 用 ADD、SUB 和 NEG 指令 ， 就 有 办 法 来 执行 汇编 语言 中 的 算术 表达 式 ， 包 括 加 法 、 
减法 和 取 反 。 换 句 话 说 ， 当 有 下 述 表 达 式 时 ， 就 可 以 模拟 C++ 编译 器 的 行为 : 


Rval = -Xval + (Yval - 2Zval); 


现在 来 看 看 ， 使 用 如 下 有 符号 32 位 变量 ,汇编 语言 是 如 何 执行 上 述 表达 式 的 。 
Rval SDWORD ? 

Xval SDWORD 26 

Yval SDWORD 30 

Zval SDWORD 40 

转换 表达 式 时 ， 先 计算 每 个 项 ， 最 后 再 将 所 有 项 结合 起 来 。 

首先 ， 对 Xval 的 副本 进行 取 反 ， 并 存 人 寄存 器 : 


; first term: -Xval 
mov eax,Xval 
neg eax ; EAX = -26 


然后 ,将 Yval 复制 到 寄存 器 中 ， 再 减 去 Zval: 


; Second term: (Yval - Zval) 
mov ebx,Yval 
sub ebx,Zval ; EBX = -10 


最 后 ,将 两 个 项 (EAX 和 EBX 的 内 容 ) 相 加 : 


; add the terms and store: 
add eax,ebx 
mov Rval,eax ; -36 


4.2.6 ”加 减法 影响 的 标志 位 
执行 算术 运算 指令 时 ， 常 常 想 要 了 解 结果 。 它 是 负数 、 正 数 还 是 零 ? 对 目的 操作 数 来 


数据 俱 送 、 寻 走 而 草 大 和 运 划 可 


说 ， 它 是 太 大 ， 还 是 太 小 ? 这 些 问题 的 答案 有 助 于 发 现 计 算 错 误 ， 和 否则 可 能 会 导致 程序 的 错 
误 行 为 。 检 查 算 术 运 算 结 果 使 用 的 是 CPU 状态 标志 位 的 值 ， 同 时 ， 这 些 值 还 可 以 触发 条 件 
分 支 指令 ， 即 基本 的 程序 逻辑 工具 。 下 面 是 对 状态 标志 位 的 简要 概述 : 
e 进位 标志 位 意味 着 无 符号 整数 溢出 。 比 如 ， 如 果 指 令 目 的 操作 数 为 8 位 ， 而 指令 产 
生 的 结果 大 于 二 进 制 的 1111 1111， 那 么 进位 标志 位 置 1。 
e 溢出 标志 位 意味 着 有 符号 整数 滋 出 。 比 如 ， 指 令 目的 操作 数 为 16 位 ,但 其 产生 的 负 
数 结果 小 于 十 进 制 的 -32 768， 那 么 溢出 标志 位 置 1。 
e 零 标志 位 意味 着 操作 结果 为 0。 比如， 如 果 两 个 值 相等 的 操作 数 相 减 ， 则 零 标志 位 置 1。 
。 符号 标志 位 意味 着 操作 产生 的 结果 为 负数 。 如 果 目 的 操作 数 的 最 高 有 效 位 (MSB) 置 
1， 则 符号 标志 位 置 1。 
e 奇偶 标志 位 是 指 ， 在 一 条 算术 或 布尔 运算 指令 执行 后 ， 立 即 判断 目的 操作 数 最 低 有 
效 字 节 中 1 的 个 数 是 否 为 偶数 。 
e 辅助 进位 标志 位 置 1， 意 味 着 目的 操作 数 最 低 有 效 字 节 中 位 3 有 进位 。 


要 在 调试 时 显示 CPU 状态 标志 位 ， 打 开 Register 窗口 ， 右 键 点 击 该 窗口 ， 并 选择 





Flags。 

1. 无 符号 数 运算 : 零 标志 位 、 进 位 标志 位 和 辅助 进位 标志 位 

当 算 术 运 算 结 果 等 于 0 时 ， 零 标志 位 置 1。 下 面 的 例子 展示 了 执行 SUB、INC 和 DEC 
指令 后 ， 目 的 寄存 器 和 零 标 志 位 的 状态 : 


mov ecx,l 


sub. ecx,1 ; ECX = 0, ZF = 工 
mov eax,OFFFFFFFFh 

inc eax ; EAX = 0, ZF = 1 
inc eax ; EAX = 1, ZF = 0 
dec eax ; EAX = 0, ZF = 1 


加 法 和 进位 标志 位 ”如 果 将 加 法 和 减法 分 开 考虑 ， 那 么 进位 标志 位 的 操作 是 最 容易 解释 
的 。 两 个 无 符号 整数 相 加 时 ， 进 位 标志 位 是 目的 操作 数 最 高 有 效 位 进位 的 副本 。 直 观 地 说 ， 
如 果 和 数 超过 了 目的 操作 数 的 存储 大 小 ， 就 可 以 认为 CF=1。 在 下 面 的 例子 里 ，ADD 指令 将 
进位 标志 位 置 1， 原 因 是 ， 相 加 的 和 数 ( 100h) 超过 了 AL 的 大 小 : 

mov al, 0FFh 

add al,l 00 CP 


图 4-3 演示 了 在 OFFh 上 加 1 时 ， 操 作 数 的 位 i a, Oe es ke 
是 如 何 变化 的 。AL 最 高 有 效 位 的 进位 复制 到 进位 荫 罗 国 本本 本 本 


标志 位 。 


行 加 !1 操作 后 ， 和 数 不 会 超过 16 位， 那么 进位 标 cr[ 1 | ofofofofofololo 


志 位 清 0: 总 

志 位 清 图 4-3 (OFFh+1 ) 使 进位 标志 位 置 1 
mov ax,00FFh 
add ax,l ; AX = 0100h, CF = 0 


但 是 ， 如 果 AX 的 值 为 FFFFh， 则 对 其 进行 加 1 操作 后 ，AX 的 高 位 就 会 产生 进位 : 


mov ax,OFFFFh 
add ax,1 ; AX = 0000, CF = 1 
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减法 和 进位 标志 位 从 较 小 的 无 符号 整数 中 减 去 较 大 的 无 符号 整数 时 ,减法 操作 就 会 将 
进位 标志 位 置 1。 图 4-4 说 明了 ， 操 作 数 为 8 位 时 , 计算 (1-2 ) 会 出 现 什么 情况 。 下 面 是 
相应 的 汇编 代码 : 


sub al,2 7; AL = FFh, CF = 1 





[lololofololololr| 


去 
位 意味 着 目的 操作 数位 3 有 进位 或 借 位 。 它 
主要 用 于 二 进 制 编码 的 十 进 制 数 (BCD) 运 wr 


算 ， 也 可 以 用 于 其 他 环境 。 现 在 ,假设 计算 pr 
( 1+0Fh)， 和 数 在 位 4 上 为 1， 这 是 位 3 的 wal wl er hl wb 


进位 : 图 4-4 (1-2 ) 使 进位 标志 位 置 1 


mov al, 0Fh 
add al,l ;AC=1 


计算 过 程 如 下 : 


六 人 二 


奇偶 标志 位 ”目的 操作 数 最 低 有 效 字 节 中 1 的 个 数 为 偶数 时 ,奇偶 (PF) 标志 位 置 1。 
下 例 中 ，ADD 和 SUB 指令 修改 了 AL 的 奇偶 性 : 


mov al,10001100b 
add al,00000010b ; AL 
sub al,10000000b ; AL 


10001110, PF 
00001110, PF 


1 
0 


执行 了 ADD 指令 后 ，AL 的 值 为 1000 1110 (4 个 0，4 个 1)，PF=1。 执行 了 SUB 指令 
，AL 的 值 包 含 了 奇数 个 1， 因 此 奇偶 标志 位 等 于 0。 

2. 有 符号 数 运算 : 符号 标志 位 和 溢出 标志 位 

符号 标志 位 ”有 符号 数 算术 操作 结果 为 负数 ， 则 符号 标志 位 置 1。 下 面 的 例子 展示 的 是 
小 数 (4 ) 减 去 大 数 (5 ): 


mov eax,4 
Sub eax,5 ; EAX = -1, SF=1 


从 机 器 的 角度 来 看 ， 符 号 标志 位 是 目的 操作 数 高 位 的 副本 。 下 面 的 例子 表示 产生 了 负数 
结果 后 ，BL 中 的 十 六 进 制 的 值 : 

mov bl,1 ; BL = 01h 

sub bl,2 ; BL = FFh (-1), SF = 1 

溢出 标志 位 ”有 符号 数 算术 操作 结果 与 目的 操作 数 相 比 ， 如 果 发 生 上 滋 或 下 溢 ， 则 溢出 
标志 位 置 1。 例 如 ， 在 第 1 章 就 了 解 到 , 8 位 有 符号 整数 的 最 大 值 为 +127， 再 加 1 就 会 溢出 : 


mov al,+127 
adG al,l ; OF = 工 


泌 
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同样 ， 最 小 的 负数 为 -128， 再 减 1 就 发 生 下 溢 。 如 果 目 的 操作 数 不 能 容纳 一 个 有 效 算 
术 运 算 结果 ， 那么 溢出 标志 位 置 1 : 

mov al,-128 

sub al,l ;7 OF = 1 

加 法 测试 ”两 数 相 加 时 ， 有 个 很 简单 的 方法 可 以 判断 是 否 发 生 溢 出 。 溢 出 发 生 的 情况 有 : 

e 两 个 正 数 相 加 ， 结 果 为 负数 

e 两 个 负数 相 加 ， 结 果 为 正 数 

如 果 两 个 加 数 的 符号 相反 ， 则 不 会 发 生 溢出 。 

硬件 如 何 检测 溢出 ”加 法 或 减法 操作 后 ，CPU 


用 一 种 有 趣 的 机 制 来 检测 溢出 标志 位 的 状态 。 计 算 Ne EL 
结果 的 最 高 有 效 位 产生 的 进位 与 结果 的 最 高 位 进行 El 
异 或 操作 ， 异 或 的 结果 存 和 人 溢出 标志 位 。 如 图 4-5 

所 示 ， 两 个 8 位 二 进 制 数 1000 0000 和 1111 1110 图 4-5 设置 溢出 标志 位 示意 图 


相 加 ， 产 生 进位 CF=1， 和 数 最 高 位 (位 7) =0， 即 1 XOR 0=1， 则 OF=1。 

NEG 指令 ”如果 NEG 指令 的 目的 操作 数 不 能 正确 存储 ， 则 该 结果 是 无 效 的 。 例 如 ， 
AL 中 存放 的 是 -128， 对 其 求 反 ， 正 确 的 结果 为 +128， 但 是 这 个 值 无 法 存 人 AL。 则 溢出 标 
志 位 置 1 就 表示 AL 中 存放 的 是 一 个 无 效 的 结果 : 

mov al -128 ; AL = 10000000b 

neg al ; AL = 10000000b, OF = 1 

反之 ， 如 果 对 +127 求 反 ,结果 是 有 效 的 ， 则 溢出 标志 位 清 0: 


mov al,+127 ; AL 
neg al ; AL 


01111111b 
10000001b, OF = 0 


CPU 如 何 知道 一 个 算术 运算 是 有 符号 的 还 是 无 符号 的 ? 答案 看 上 去 似乎 有 点 思春 : 
它 不 知道 ! 在 算术 运算 之 后 ， 不 论 标志 位 是 否 与 之 相关 ，CPU 都 会 根据 一 组 布尔 规则 来 


设置 所 有 的 状态 标志 位 。 程 序 员 要 根据 执行 操作 的 类 型 ， 来 决定 哪些 标志 位 需要 分 析 ， 
哪些 可 以 忽略 。 





4.2.7 示例 程序 (AddSubTest ) 


AddSubTest 程序 利用 ADD、SUB、INC、DEC 和 NEG 指令 执行 各 种 算术 运算 表达 式 ， 
并 展示 了 相关 状态 标志 位 是 如 何 受到 影响 的 : 
; 加 法 和 减法 (AddSubTest .asm) 


.386 
.model flat,stdcall 
.Stack 4096 
ExitProcess proto,dwExitCode:dword 
.data 
Rval SDWORD ? 
Xval SDWORD 26 
Yval SDWORD 30 
Zval SDWORD 40 
.code 
main PROC 

;INC 和 DEC 
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mov ax,1000h 

inc ax ; 1001h 
dec ax ; 1000h 
; 表达 式 ; Rval=-Xval+(Yval-Zval 

mov eax, Xval 
neg eax 

mov ebx, Yval 
sub ebx,Zval a | 
add eax, ebx 


movV Rval ,eax 5 =36 

; 零 标志 位 示例 

mov (2 

sub cs 了 
mov ax,OFFFFh 

inc ax ; ZF = 1 
; 符号 标志 位 示例 

mov cx,0 

sub cx,l1 2 SP = 工 
mov ax,7FFFh 

add ax,2 i SF 并 


; 进位 标志 位 示例 
mov ”al, 0FFh 
add alr1 

; 洲 出 标志 位 示例 
mov al,+127 
add al,l 

mov al,-128 
subB alil ; OF = 1 


INVOKE ExitProcess,0 
main ENDP 


[1 END main 


4.2.8 本 节 回 顾 
问题 1 一 问题 5 使 用 如 下 数据 : 


.data 

vall BYTE 10h 
val2 WORD 8000h 
val3 DWORD OFFFFh 
val4 WORD 7FFFh 


1. 编写 一 条 指令 实现 val2 加 1。 

2. 编写 一 条 指令 实现 从 EAX 中 减 去 val3。 

3. 编写 指令 实现 从 val2 中 减 去 val4。 

4. 如 果 用 ADD 指令 实现 val2 加 1， 则 进位 标志 位 和 符号 标志 位 的 值 是 多 少 ? 

5. 如 果 用 ADD 指令 实现 val4 加 1， 则 溢出 标志 位 和 符号 标志 位 的 值 是 多 少 ? 

6. 有 如 下 程序 段 ， 每 条 指令 执行 后 ， 写 出 进位 标志 位 、 符 号 标志 位 、 零 标志 位 和 溢出 标志 位 


的 值 : 

mov ax,7FFOh 

add al,10h 1 a CR 三 SF = ZF = OF = 
add ah,l Bs. GE 二 SF = ZF = OF = 
add ax,2 ;Be CF SF = ZF = OF = 
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4.3 与 数据 相关 的 运算 符 和 伪 指 令 

运算 符 与 伪 指 令 不 是 可 执行 指令 ,反之 ,它们 由 汇编 器 进行 分 析 。 使 用 一 些 汇编 语言 伪 
指令 可 以 获取 数据 地 址 和 大 小 的 信息 : 
OFFSET 运算 符 返 回 的 是 一 个 变量 与 其 所 在 段 起 始 地 址 之 间 的 距离 。 
PTR 运算 符 可 以 重 写 操作 数 默 认 的 大 小 类 型 。 
TYPE 运算 符 返 回 的 是 一 个 操作 数 或 数组 中 每 个 元 素 的 大 小 ( 按 字 节 计 )。 
LENGHTOF 运算 符 返 回 的 是 数组 中 元 素 的 个 数 。 
SIZEOF 运算 符 返 回 的 是 数组 初始 化 时 使 用 的 字 节 数 。 

此 外 ，LABEL 伪 指 令 可 以 用 不 同 的 大 小 类 型 来 重新 定义 同一 个 变量 。 本 章 的 运算 符 和 
伪 指 令 只 代表 MASM 支持 的 一 小 部 分 运算 符 ， 完 整 内 容 参见 附录 D。 


4.3.1 OFFSET 运算 符 


OFFSET 运算 符 返 回 数据 标号 的 偏 移 量 。 这 个 偏 移 量 按 字 节 计算 ， 表 示 的 是 该 数据 标号 
距离 数据 段 起 始 地 址 的 距离 。 图 4-6 所 示 为 数据 段 内 名 为 myByte 的 变量 。 
OFFSET 示例 


偏 移 量 
在 下 面 的 例子 中 ， 将 用 到 如 下 三 种 类 型 的 变量 : si 
aut 娄 毛 有 | 图 | 
bval BYTE 2? i 
wVal WORD ? 
dVal DWORD ? 图 4-6 名 为 myByte 的 变量 


dVal2 DWORD ? 


假设 bval 在 偏 移 量 为 0040 4000 (十 六 进 制 ) 的 位 置 ， 则 OFFSET 运算 符 返 回 值 如 下 : 


mov esi,OFFSET bVal ; ESI = 00404000h 
mov esi,OFFSET wvVal ; ESI = 00404001h 
mov esi,OFFSET dVal ; ESI = 00404003h 
mov esi,OFFSET dvVal2 ; ESI = 00404007h 


OFFSET 也 可 以 应 用 于 直接 - 偏 移 量 操作 数 。 设 myArray 包含 5 个 16 位 的 字 。 下 面 的 
MOYV 指令 首先 得 到 myArray 的 偏 移 量 ， 然 后 加 4， 再 将 形成 的 结果 地 址 直接 传送 给 ESI。 
因此 ， 现 在 可 以 说 ESI 指向 数组 中 的 第 3 个 整数 。 


.data 

myArray WORD 1,2,3,4,5 
.Code 

mov esi,OFFSET myArray + 4 


还 可 以 用 一 个 变量 的 偏 移 量 来 初始 化 男 一 个 双 字 变量 ， 从 而 有 效 地 创建 一 个 指针 。 如 下 
例 所 示 ，pArray 就 指向 bigArray 的 起 始 地 址 : 


.data 
bigArray DWORD 500 DUP(?) 
pArray DWORD bigArray 


下 面 的 指令 把 该 指针 的 值 加 载 到 ESI 中 ， 因 此 ， 这 个 ESI 寄存 器 就 可 以 指向 数组 的 起 始 
地 址 : 


mov esi,pArray 
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4.3.2 ALIGN 伪 指 令 
ALIGN 人 擅 指 令 将 一 个 变量 对 齐 到 字 节 边界 、 字 边界 、 双 字 边 界 或 段落 边界 。 语 法 如 下 : 


ALIGN bound 


Bound 可 取 值 有 : 1、2、4、8、16。 当 取 值 为 1 时 ， 则 下 一 个 变量 对 齐 于 1 字 节 边界 ( 默 
认 情 况 )。 当 取 值 为 2 时， 则 下 一 个 变量 对 齐 于 偶数 地 址 。 当 取 值 为 4 时 ， 则 下 一 个 变量 地 
址 为 4 的 倍数 。 当 取 值 为 16 时 ， 则 下 一 个 变量 地 址 为 16 的 倍数 ， 即 一 个 段落 的 边界 。 为 了 
满足 对 齐 要 求 ， 汇 编 器 会 在 变量 前 插入 一 个 或 多 个 空 字 节 。 为 什么 要 对 齐 数据 ?因为 ， 对 于 
存储 于 偶 地 址 和 奇 地 址 的 数据 来 说 ，CPU 处 理 偶 地 址 数据 的 速度 要 快 得 多 。 

下 述 例子 中 ，bVal 处 于 任意 位 置 ,但 其 偏 移 量 为 0040 4000。 在 wVval 之 前 插入 ALIGN 
2 伪 指 令 ， 这 使 得 wVal 对 齐 于 偶 地 址 偏 移 量 : 


bVal BYTE ? ; 00404000h 
ALIGN 2 

wal WORD ? ; 00404002h 
bVal2 BYTE ? ; 00404004h 
ALIGN 4 

dVal DWORD ? ; 00404008h 
dVal2 DWORD ? ; 0040400Ch 


请 注意 ，dVal 的 偏 移 量 原本 是 0040 4005， 但 是 ALIGN 4 伪 指 令 使 它 的 偏 移 量 成 为 
0040 4008。 


4.3.3 ”PTR 运算 符 


PTR 运算 符 可 以 用 来 重 写 一 个 已 经 被 声明 过 的 操作 数 的 大 小 类 型 。 只 要 试图 用 不 同 于 汇 
编 器 设 定 的 大 小 属性 来 访问 操作 数 ， 那 么 这 个 运算 符 就 是 必需 的 。 

例如 ， 假 设想 要 将 一 个 双 字 变量 myDouble 的 低 16 位 传送 给 AX。 由 于 操作 数 大 小 不 匹 
配 ， 因 此 ， 汇 编 器 不 会 允许 这 种 操作 


.data 

myDouble DWORD 12345678h 
.code 

mov ax,myDouble 


但 是 ， 使 用 WORD PTR 运算 符 就 能 将 低位 字 ( 5678h) 送 入 AX: 


mov ax,WORD PTR myDouble 


为 什么 送 入 AX 的 不 是 1234h ? 因为 ，x86 处 理 器 采用 的 是 小 端 存储 格式 (参见 3.4.9 
节 )， 即 低位 字 节 存放 于 变量 的 起 始 地 址 。 如 图 4-7 所 示 ， 用 三 种 方式 表示 myDouble 的 内 
存 布局 : 第 一 列 是 一 个 双 字 ， 第 二 列 是 两 个 字 ( 5678h、1234h)， 第 三 列 是 四 个 字 节 (78h、 
56h、 34h、12h)。 

不 论 该 变量 是 如 何 定义 的 ， 都 可 以 用 三 种 双 字 


字 ” 字 节 偏 移 量 
方法 中 的 任何 一 种 来 访问 内 存 。 比 如 ， 如 果 


12345678 | 5678 0000 myDouble 






myDouble 的 偏 移 量 为 0000， 则 以 这 个 偏 移 量 0001 myDouble+ 1 
为 首 地 址 存放 的 16 位 值 是 5678h。 同 时 也 可 以 0000 myDouble+2 


检索 到 1234h， 其 字 地 址 为 myDouble+2， 指 令 3 


如 下 ， 图 4-7 myDouble 的 内 存 布局 
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mov ax,WORD PTR [myDouble+2] ; 1234h 


同样 ， 用 BYTE PTR 运算 符 能 够 把 myDouble 的 单个 字 节 传送 到 BL: 


mov bl,BYTE PTR myDouble ; 78h 


注意 ，PTR 必须 与 一 个 标准 汇编 数据 类 型 一 起 使 用 ， 这 些 类 型 包括 : BYTE、SBYTE、 
WORD、SWORD、DWORD、SDWORD、FWORD、QWORD 或 TBYTE。 

将 较 小 的 值 送 入 较 大 的 目的 操作 数 ”程序 可 能 需要 将 两 个 较 小 的 值 送 入 一 个 较 大 的 目 
的 操作 数 。 如 下 例 所 示 ， 第 一 个 字 复制 到 EAX 的 低 半 部 分 ， 第 二 个 字 复 制 到 高 半 部 分 。 而 
DWORD PTR 运算 符 能 实现 这 种 操作 : 


.data 

wordList WORD 5678h,1234h 

.Code 

mov eax,DWORD PTR wordList ; EAX = 12345678h 


4.3.4 TYPE 运算 符 


TYPE 运算 符 返 回 变量 单个 元 素 的 大 小 ， 这 个 大 小 是 以 字 节 为 单位 计算 的 。 比 如 ， 
TYPE 为 字 节 ， 返 回 值 是 1 ; TYPE 为 字 ， 返 回 值 是 2 ; TYPE 为 双 字 ， 返 回 值 是 4; TYPE 
为 四 字 ， 返回 值 是 8。 示例 如 下 : 


.data 
varl BYTE  ? 
var2 WORD  ? 
var3 DWORD ? 
Var4 QWORD ? 
下 表 是 每 个 TYPE 表达 式 的 值 。 
表达 式 表达 式 什 
rs | 1! | Tree | 4 
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LENGTHOF 运算 符 计算 数组 中 元 素 的 个 数 ， 元 素 个 数 是 由 数组 标号 同一 行 出 现 的 数值 
来 定义 的 。 示 例如 下 : 

.data 

bytel BYTE, 10,20;30 

arrayl WORD 30 DUP(?),0,0 

array2 WORD 5 DUP(3 DUP(?)) 

array3 DWORD 1,2,3,4 

digitStr BYTE *12345678",0 


如 果 数 组 定义 中 出 现 了 髋 套 的 DUP 运算 符 ， 那么 LENGTHOF 返回 的 是 两 个 数值 的 乘 
只。 下 表 列 出 了 每 个 LENGTHOF 表达 式 返回 的 数值 。 


EOTHOP sey 
LENOTHOF digisy 



















LENGTHOF bytel 
LENGTHOF arrayl 


LENGTHOF array2 5*3 
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如 果 数 组 定义 占据 了 多 个 程序 行 ， 那 么 LENGTHOF 只 针对 第 一 行 定义 的 数据 。 比 如 有 
如 下 数据 ， 则 LENGHTOF myArray 返回 值 为 5: 
myArray BYTE 10,20,30,40,50 
BYTE 60,70,80,90,100 
另外 ， 也 可 以 在 第 一 行 结尾 处 用 逗号 ， 并 在 下 一 行 继续 进行 数组 初始 化 。 若 有 如 下 数据 
定义 ，LENGHOF myArray 返回 值 为 10: 


myArray BYTE 10,20,30,40,50, 
60,70,80,90,100 


4.3.6 SIZEOF 运算 符 


SIZEOF 运算 符 返 回 值 等 于 LENGTHOF 与 TYPE 返回 值 的 乘积 。 如 下 例 所 示 ，intArray 
数组 的 TYPE=2，LENGTHOF=32， 因 此 ，SIZEOF intArray=64: 


.data 

intArray WORD 32 DUP(0) 

.Code 

mov eax,SIZEOF intArray ; EAX = 64 


4.3.7 LABEL 伪 指令 


LABEL 伪 指 令 可 以 插入 一 个 标号 ， 并 定义 它 的 大 小 属性 ， 但 是 不 为 这 个 标号 分 配 存储 
空间 。LABEL 中 可 以 使 用 所 有 的 标准 大 小 属性 ， 如 BYTE、WORD、DWORD、QWORD 
或 TBYTE。LABEL 常见 的 用 法 是 ， 为 数据 段 中 定义 的 下 一 个 变量 提供 不 同 的 名 称 和 大 小 属 
性 。 如 下 例 所 示 ， 在 变量 val32 前 定义 了 一 个 变量 ， 名 称 为 val16， 属 性 为 WORD: 


.data 
vall6 LABEL WORD 
val32 DWORD 12345678h 


.Code 
mov ax,vallé6 ; AX = 5678h 
mov dx, [vall6+2] ; DX = 1234h 


val16 与 val32 共享 同一 个 内 存 位 置 。LABEL 伪 指 令 自 身 不 分 配 内 存 。 
有 时 需要 用 两 个 较 小 的 整数 组 成 一 个 较 大 的 整数 ， 如 下 例 所 示 ， 两 个 16 位 变量 组 成 一 
个 32 位 变量 并 加 载 到 EAX 中 : 


.data 

LongValue LABEL DWORD 

vall WORD 5678h 

val2 WORD 1234h 

.Code 

mov eax,LongValue ; EAX = 12345678h 


4.3.8 ”本 节 回顾 


1.( 真 / 假 ): OFFSET 运算 符 总 是 返回 一 个 16 位 的 数值 。 
2.( 真 / 假 ); PTR 运算 符 返回 变量 的 32 位 地 址 。 
3.( 真 / 假 ): 对 双 字 操作 数 ，TYPE 运算 符 返 回 值 为 4。 
4.( 真 / 假 ): LENGTHOF 运算 符 返 回 操作 数 的 字 节 数 。 
5.( 真 / 假 ): SIZEOF 运算 符 返 回 操作 数 的 字 节 数 。 
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4.4 间接 寻 址 


直接 寻 址 很 少 用 于 数组 处 理 ， 因 为 ， 用 常数 偏 移 量 来 寻 址 多 个 数组 元 素 时 ， 直 接 寻 址 不 
实用 。 反 之 ， 会 用 寄存 器 作为 指针 〈 称 为 间接 寻 址 ) 并 控制 该 寄存 器 的 值 。 如 果 一 个 操作 数 
使 用 的 是 间接 寻 址 ， 就 称 之 为 间接 操作 数 。 


4.4.1 间接 操作 数 


保护 模式 ”任何 一 个 32 位 通用 寄存 器 (EAX、EBX、ECX、EDX、ESI、EDI、EBP 和 
ESP) 加 上 括号 就 能 构成 一 个 间接 操作 数 。 寄 存 器 中 存放 的 是 数据 的 地 址 。 示 例如 下 ，ESI 
存放 的 是 byteVal 的 偏 移 量 ，MOYV 指令 使 用 间接 操作 数 作为 源 操作 数 ， 解 析 ESI 中 的 偏 移 
量 ,， 并 将 一 个 字 节 送信 AL: 


.data 

byteVal BYTE 10h 

.Code 

mov esi,OFFSET byteVal 

mov al, [esi] ; AL = 10 


如 果 目 的 操作 数 也 是 间接 操作 数 ， 那 么 新 值 将 存 人 由 寄存 器 提供 地 址 的 内 存 位 置 。 在 下 
面 的 例子 中 ，BL 寄存 器 的 内 容 复制 到 ESI 寻 址 的 内 存 地 址 中 : 


mov [esi],bl 


PTR 与 间接 操作 数 一 起 使 用 一 个 操作 数 的 大 小 可 能 无 法 从 指令 中 直接 看 出 来 。 下 面 
的 指令 会 导致 汇编 器 产生 “operand must have size (操作 数 必须 有 大 小 )” 的 错误 信息 : 


inc [esi] ; 错误 : operand must have size 


汇编 器 不 知道 ESI 指针 的 类 型 是 字 节 、 字 、 双 字 ， 还 是 其 他 的 类 型 。 而 PTR 运算 符 则 
可 以 确定 操作 数 的 大 小 类 型 : 


inc BYTE PTR [esi] 


4.4.2 数组 


间接 操作 数 是 步 进 遍历 数组 的 理想 工具 。 下 例 中 , arrayB 有 3 个 字 节 ， 随 着 ESI 不 断 加 1， 
它 就 能 顺序 指向 每 一 个 字 节 : 


.data 

arrayB BYTE 10h,20h,30h 

.Code 

mov esi,OFFSET arrayB 

mov al, [esi] RE = 10h 
inc esi 

mov al, [esi] ; AL = 20h 
inc esi 

mov al, [esi] ; AL = 30h 


如 果 数 组 是 16 位 整数 类 型 ， 则 ESI 加 2 就 可 以 顺序 寻 址 每 个 数组 元 素 : 


.data 

arrayW WORD 1000h,2000h,3000h 
.code 

mov esi,OFFSET arrayW 
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mov ax, [esi] ; AX = 1000h 

add esi,2 

mov ax, [esil] ; AX = 2000h 

add esi,2 

mov ax, [esi] ; AX = 3000h 

假设 arrayW 的 偏 移 量 为 10200h， 下 图 展示 的 是 ESI 初始 值 相对 数组 数据 的 位 置 : 
偏 移 量 值 


10200 | 1000h |<— [esi] 


10202 2000h 
10204 
示例 : 32 位 整数 相 加 ”下面 的 代码 示例 实现 的 是 3 个 双 字 相 加 。 由 于 双 字 是 4 个 字 节 
的 ， 因此 ，ESI 要 加 4 才能 顺序 指向 每 个 数组 数值 ; 


.data 

arrayD DWORD 10000h,20000h,30000h 
.Code 

mov esi,OFFSET arrayD 

mov eax, [esi] ;( 第 一 个 数 ) 

add esi,4 

add eax, [esi]  ; (第 二 个 数 ) 

add esi,4 

add eax, [esi]  ;( 第 三 个 数 ) 


假设 arrayD 的 偏 移 量 为 10200h。 下 图 展示 的 是 ESI 初始 值 相 对 数组 数据 的 位 置 : 
偏 移 量 值 


10200 1000h = |<— [esi] 


10204 2000h |<<— [esij+4 
10208 3000h |<— [esi]+8 


4.4.3 变 址 操作 数 


变 址 操作 数 是 指 ， 在 寄存 器 上 加 上 常数 产生 一 个 有 效 地 址 。 每 个 32 位 通用 寄存 器 都 可 以 
用 作 变 址 寄存 器 。MASM 可 以 用 不 同 的 符号 来 表示 变 址 操作 数 (括号 是 表示 符号 的 一 部 分 ): 


constant[reg] 
[constant + regl 


第 一 种 形式 是 变量 名 加 上 寄存 器 。 变 量 名 由 汇编 器 转换 为 常数 ， 代 表 的 是 该 变量 的 偏 移 
量 。 下 面 给 出 的 是 两 种 符号 形式 的 例子 : 


变 址 操作 数 非常 适合 于 数组 处 理 。 在 访问 第 一 个 下 
数组 元 素 之 前 ， 变 址 寄存 器 需要 初始 化 为 0: . 


.data 

arrayB BYTE 10h,20h,30h 

.Code 

mov esi,0 

mov al,arrayBlesi] 7 AD = LI0h 


最 后 一 条 语句 将 ESI 和 arrayB 的 偏 移 量 相 加 ， 表 达 式 [arrayB+ESI] 产生 的 地 址 被 解析 ， 
并 将 相应 内 存 字 节 的 内 容 复制 到 AL。 
增加 位 移 量变 址 寻 址 的 第 二 种 形式 是 寄存 器 加 上 常数 偏 移 量 。 变 址 寄存 器 保存 数组 或 
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结构 的 基 址 ， 常 数 标识 各 个 数组 元 素 的 偏 移 量 。 下 例 展示 了 在 一 个 16 位 字数 组 中 如 何 使 用 
这 种 形式 : 

-data 

arrayW WORD 1000h,2000h,3000h 


.Code 
mov esi,OFFSET arrayW 


mov ax, [esil] ; AX = 1000h 
mov ax, [esi+2] ; AX = 2000h 
mov ax, [esi+4] ; AX = 3000h 


使 用 16 位 寄存 器 ”在 实地 址 模式 中 ， 一般 用 16 位 寄存 器 作为 变 址 操作 数 。 在 这 种 情况 
下 ， 能 被 使 用 的 寄存 器 只 有 SI、DI、BX 和 BP: 


mov al,arrayB[si] 
mov ax,arrayW[dil] 
mov eax,arrayD[bx] 


如 果 有 间接 操作 数 ， 则 要 避免 使 用 BP 寄存 器 ， 除 非 是 寻 址 堆栈 数据 。 

变 址 操作 数 中 的 比例 因子 

在 计算 偏 移 量 时 ， 变 址 操作 数 必须 考虑 每 个 数组 元 素 的 大 小 。 比 如 下 例 中 的 双 字 数组 ， 
下 标 (3 ) 要 乘 以 4 (一 个 双 字 的 大 小 ) 才能 生成 内 容 为 400h 的 数组 元 素 的 偏 移 量 : 


-data 

arrayD DWORD 1l00h, 200h, 300h, 400h 

.Code 

mov esi,3 * TYPE arrayD ee 的 偏 移 量 
mov eax,arrayD[esil] EAX = 400h 


Intel 设计 师 希 望 能 让 编译 器 编写 者 的 常用 操作 更 容易 ， 因 此 ， 他 们 提供 了 一 种 计算 偏 移 
量 的 方法 ， 即 使 用 比例 因子 。 比 例 因子 是 数组 元 素 的 大 小 ( 字 =2， 双 字 =4， 四 字 =8 ) 。 现 
在 对 刚才 的 例子 进行 修改 ， 将 数组 下 标 (3 ) 送 入 ESI， 然 后 ESI 乘 以 双 字 的 比例 因子 (4 ): 


.data 
arrayD DWORD 1,2,3,4 
.Code 
mov esi,3 ; 下 标 
mov eax, arrayD[esi*41] ; EAX = 4 
TYPE 运算 符 能 让 变 址 更 加 灵活 ， 它 可 以 让 arrayD 在 以 后 重新 定义 为 别 的 类 型 : 
mov esi,3 ; 下 标 
mov eax,arrayD[esi*TYPE arrayD] ; EAX = 4 
4.4.4 ”指针 


如 果 一 个 变量 包含 男 一 个 变量 的 地 址 ， 则 该 变量 称 为 指针 。 指 针 是 控制 数组 和 数据 结构 
的 重要 工具 ， 因 为 ， 它 包含 的 地 址 在 运行 时 是 可 以 修改 的 。 比 如 ， 可 以 使 用 系统 调用 来 分 配 
(保留 ) 一 个 内 存 块 ， 再 把 这 个 块 的 地 址 保存 在 一 个 变量 中 。 指 针 的 大 小 受 处 理 器 当前 模式 
(32 位 或 64 位 ) 的 影响 。 下 例 为 32 位 的 代码 ， 


.data 
arrayB byte 10h,20h,30h,40h 
PtrB dword arrayB 


还 可 以 用 OFFSET 运算 符 来 定义 ptrB， 从 而 使 得 这 种 关系 更 加 明确 : 
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ptrB dword OFFSET arrayB 


本 书 中 32 位 模式 程序 使 用 的 是 近 指 针 ， 因 此 ， 它 们 保存 在 双 字 变量 中 。 这 里 有 两 个 例 
子 : ptrB 包含 arrayB 的 偏 移 量 ，ptrW 包含 arrayW 的 偏 移 量 : 


arrayB BYTE 10h,20h,30h,40h 
arrayW “ WORD 1i000h,2000h,3000h 
ptrB DWORD arrayB 

ptrW DWORD arrayW 


同样 ， 也 还 可 以 用 OFFSET 运算 符 使 这 种 关系 更 加 明确 : 


ptrB DWORD OFFSET arrayB 
ptrWw DWORD OQFFSET arrayW 


高 级 语言 刻意 隐藏 了 指针 的 物理 细节 ， 这 是 因为 机 器 结构 不 同 ， 指 针 的 实现 也 有 差 


异 。 汇 编 语言 中 ， 由 于 面 对 的 是 单一 实现 ， 因 此 是 在 物理 层 上 检查 和 使 用 指针 。 这 样 有 
助 于 消除 围绕 着 指针 的 一 些 神 秘 感 。 





使 用 TYPEDEF 运算 符 

TYPEDEF 运算 符 可 以 创建 用 户 定义 类 型 ， 这 些 类 型 包含 了 定义 变量 时 内 置 类 型 的 所 有 
状态 。 它 是 创建 指针 变量 的 理想 工具 。 比 如 ， 下 面 声明 创建 的 一 个 新 数据 类 型 PBYTE 就 是 
一 个 字 节 指针 : 


PBYTE TYPEDEF PTR BYTE 


这 个 声明 通常 放 在 靠近 程序 开始 的 地 方 ， 在 数据 段 之 前 。 然 后 ， 变 量 就 可 以 用 PBYTE 


来 定义 : 
.data 
arrayB BYTE 10h,20h,30h,40h 
ptrl PBYTE ? 7 未 初始 化 
121 ptr2 PBYTE arrayB  ; 指向 一 个 数组 


示例 程序 : Pointers 下 面 的 程序 (pointers.asm) 用 TYPEDEF 创建 了 3 个 指针 类 型 
(PBYTE、PWORD、PDWORD)。 此 外 ， 程 序 还 创建 了 几 个 指针 ， 分配 了 一 些 数 组 偏 移 量 ， 
并 解析 了 这 些 指 针 : 


TITLE Pointers (Pointers .asm) 


.386 

.model flat,stdcall 

.Stack 4096 

ExitProcess proto,dwExitCode:dword 
; 创建 用 户 定义 类 型 

PBYTE TYPEDEF PTR BYTE  ; 字 节 指针 
PWORD TYPEDEF PTR WORD  ; 字 指针 
PDWORD TYPEDEF PTR DWORD ，; 双 字 指针 


.data 

arrayB BYTE 10h,20h,30h 
arrayW WORD 1,2,3 
arrayD DWORD 4,5,6 

; 创建 几 个 指针 变量 

PtEr1l PBYTE arrayB 

ptr2 PWORD arrayW 

ptr3 PDWORD arrayD 
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.Code 
main PROC 
; 使 用 指针 访问 数据 


mov 
mov 
IOV 
mov 
mov 
InOV 


esi,ptrl 

al, [esi] -10 
esi,ptr2 

ax, [esi] We 
esi,ptr3 

eax, [esi] 7 得 


invoke ExitProcess,0 
main ENDP 
END main 


4.4.5 ”本 节 回 顾 


1.( 真 / 假 ): 任何 一 个 32 位 通用 寄存 器 都 可 以 用 作 间 接 操作 数 。 
2.( 真 / 假 ): EBX 寄存 器 通常 是 保留 的 ， 用 于 寻 址 堆栈 。 
3.( 真 / 假 ): 指令 inc [esi] 是 非法 的 。 
4.( 真 / 假 ): array[esi] 是 变 址 操作 数 。 
问题 5 一 问题 6 使 用 如 下 数据 定义 : 


myBytes BYTE 10h,20h,30h,40h 
myWords WORD 8Ah,3Bh,72h,44h,66h 
myDoubles DWORD 1,2,3,4,5 
myPointer DWORD myDoubles 


5. 有 如 下 指令 序列 ， 填 写 右 侧 要 求 的 寄存 器 的 值 。 


IIOV 
mov 
mov 
mov 
mov 
mov 
mov 
mov 
mov 
IOV 


esi,OFFSET myBytes 


al, [esi] 


a. AL = 
al, [esi+3] b. AL = 
esi,OFFSET myWords + 2 
ax, [esi] ; CC. AX = 
edi,8 
edx, [myDoubles + edil] ; G: EDE = 
edx,myDoubles [edi] ; e. EDX = 
ebx,myPointer 
eax, [Pbx+4] ; £f. EAX = 


6. 有 如 下 指令 序列 ， 填 写 右 侧 要 求 的 寄存 器 的 值 。 


IOV 
mov 
mov 
TIOV 
mov 
mov 
TOV 


esi,OFFSET myBytes 


ax, [esi] 


ss 
eax, DWORD PTR myWords ; DD. 
esi,myPointer 
ax, [esi+2] 
ax, [esi+6] 
ax, [esi-— 


on 


4] ; e. 


4.5 JMP 和 LOOP 指令 


默认 情况 下 ，CPU 是 顺序 加 载 并 执行 程序 。 但 是 ， 当 前 指令 有 可 能 是 有 条 件 的 ， 也 就 
是 说 ， 它 按照 CPU 状态 标志 ( 零 标志 、 符 号 标志 、 进 位 标志 等 ) 的 值 ， 把 控制 转向 程序 中 的 
新 位 置 。 汇 编 语言 程序 使 用 条 件 指令 来 实现 如 IF 语句 的 高 级 语句 与 循环 。 每 条 条 件 指令 都 
包含 了 一 个 可 能 的 转向 不 同 内 存 地 址 的 转移 ( 跳 转 )。 控 制 转移 ,或 分 支 ， 是 一 种 改变 语句 


执行 顺序 的 方法 ， 它 有 两 种 基本 类 型 : 
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。 无 条 件 转移 : 无 论 什么 情况 都 会 转移 到 新 地 址 。 新 地 址 加 载 到 指令 指针 寄存 器 ， 使 
得 程序 在 新 地 址 进行 执行 。JMP 指令 实现 这 种 转移 。 
。 条 件 转移 : 满足 某 种 条 件 ， 则 程序 出 现 分 支 。 各 种 条 件 转移 指令 还 可 以 组 合 起 来 ， 形 
成 条 件 逻 辑 结构 。CPU 基于 ECX 和 标志 寄存 器 的 内 容 来 解释 真 / 假 条 件 。 
4.5.1 JMP 指令 


JMP 指令 无 条 件 跳 转 到 目标 地 址 ， 该 地 址 用 代码 标号 来 标识 ， 并 被 汇编 器 转换 为 偏 移 
量 。 语 法 如 下 所 示 : 


JMP destination 


当 CPU 执行 一 个 无 条 件 转移 时 ， 目 标 地 址 的 偏 移 量 被 送 入 指令 指针 寄存 器 ， 从 而 导致 
从 新 地 址 开始 继续 执行 。 


创建 一 个 循环 ”JMP 指令 提供 了 一 种 简单 的 方法 来 创建 循环 ， 即 跳 转 到 循环 开始 时 的 
标号 : 


top: 
jp top ;不 断 地 循环 
JMP 是 无 条 件 的 ， 因 此 循环 会 无 休止 地 进行 下 去 ， 除 非 找到 其 他 方法 退出 循环 。 
4.5.2 LOOP 指令 


LOOP 指令 ， 正 式 称 为 按照 ECX 计数 器 循环 ， 将 程序 块 重复 特定 次 数 。ECX 自动 成 为 
计数 器 ， 每 循环 一 次 计数 值 减 1。 语 法 如 下 所 示 : 


LOOP destination 
循环 目标 必须 距离 当前 地 址 计数 器 -128 到 +127 字 节 范围 内 。LOOP 指令 的 执行 有 两 个 


步骤 : 第 一 步 ， ECX 减 1， 第 二 步 , 将 ECX 与 0 比较 。 如 果 ECX 不 等 于 0， 则 跳 转 到 由 目 
标 给 出 的 标号 。 和 否则， 如 果 ECX 等 于 0， 则 不 发 生 跳 转 ， 并 将 控制 传递 到 循环 后 面 的 指令 。 


实地 址 模式 中 ，CX 是 LOOP 指令 的 默认 循环 计数 器 。 同 时 ，LOOPD 指令 使 用 


ECX 为 循环 计数 器 ，LOOPW 指令 使 用 CX 为 循环 计数 器 。 
下 面 的 例子 中 ， 每 次 循环 是 将 AX 加 1。 当 循环 结束 时 ，AX=5，ECX=0: 


mov ax,0 
mov ecx,5 





Le 
inc ax 
loop L1 


一 个 常见 的 编程 错误 是 ， 在 循环 开始 之 前 ， 无 意 间 将 ECX 初始 化 为 0。 如 果 执 行 了 这 
个 操作 ，LOOP 指令 将 ECX 减 1 后 ， 其 值 就 为 FFFFFFFFh， 那么 循环 次 数 就 变 成 了 4 294 
967 296 ! 如 果 计 数 器 是 CX (实地 址 模式 下 )， 那 么 循环 次 数 就 为 65 536。 

有 时 ， 可 能 会 创建 一 个 太 大 的 循环 ， 以 至 于 超过 了 LOOP 指令 允许 的 相对 跳 转 范围 。 下 
面 给 出 是 MASM 产生 的 一 条 错误 信息 ， 其 原因 就 是 LOOP 指令 的 跳 转 目标 太 远 了 : 


error A2075: jump destination too far : by 14 byte(s) 


履 据 侍 送 、 录 鼻 和 和 交大 远 章 97 


基本 上 ， 在 一 个 循环 中 不 用 显 式 的 修改 ECX， 否 则 ，LOOP 指令 可 能 无 法 正常 工作 。 下 
例 中 ,每 次 循环 ECX 加 1。 这 样 ECX 的 值 永远 不 能 到 0， 因 此 循环 也 永远 不 会 停止 : 


top: 


inc ecx 
loop top 


如 果 需 要 在 循环 中 修改 ECX， 可 以 在 循环 开始 时 ， 将 ECX 的 值 保存 在 变量 中 ， 再 在 
LOOP 指令 之 前 恢复 被 保存 的 计数 值 : 
.data 
ne DWORD ? 
.Code 
mov ecx,100 ; 设置 循环 计数 值 
top: 
mov count,ecx ;保存 计数 值 


mov ecx,20 ; 修改 ECX 


mov ecx,count  ; 恢复 计数 值 
loop top 


循环 妊 套 ” 当 在 一 个 循环 中 再 创建 一 个 循环 时 ， 就 必须 特别 考虑 外 层 循环 的 计数 器 
ECX， 可 以 将 它 保存 在 一 个 变量 中 : 


.data 
count DWORD ? 
.Code 
mov ecx,100 ; 设置 外 层 循环 计数 值 
L1: 
mov count,ecx ;保存 外 层 循环 计数 值 
mov ecx,20 7 设置 内 层 循环 计数 值 
L223 
loop L2 ; 重复 内 层 循环 
mov ecx,count  ; 恢复 外 层 循 环 计数 值 
loop L1 ; 重复 外 层 循环 


作为 一 般 规则 ， 多 于 两 重 的 循环 柑 套 难以 编写 。 如 果 使 用 的 算法 需要 多 重 循 环 ， 则 将 一 
些 内 层 循环 用 子 程序 来 实现 。 


4.5.3 在 Visual Studio 调试 器 中 显示 数组 


在 调试 期 间 ， 如 果 想 要 显示 数组 的 内 容 ， 步 又 如 下 : 选择 Debug 菜单 一 选择 
Windows 一 选择 Memory 一 选择 Memory 1。 则 出 现 内 存 窗 口 ， 可 以 用 鼠标 拖 动 并 停靠 在 
Visual Studio 工作 区 的 任何 一 边 。 还 可 以 右键 点 
击 该 窗口 的 标题 栏 ， 表明 要 这 个 窗口 浮动 在 编 | sot ett. 


Count EQU LENGIHOF array 


辑 窗 口 之 上 。 在 内 存 窗口 上 端的 Address 栏 里 ， 
键 信 符 号 和 数组 名 称 ， 然 后 点 击 Enter。 比 
如 ，&myArray 就 是 一 个 有 效 的 地 址 表达 式 。 内 
存 窗口 将 显示 从 这 个 数组 地 址 开始 的 内 存 块 ， 如 
图 4-8 所 示 。 图 4-8 ”使 用 调试 器 的 内 存 窗口 显示 数组 
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如 果 数 组 的 值 是 双 字 ， 可 以 在 内 存 窗 口中 ， 点 击 右键 并 在 弹出 菜单 里 选择 4-byte 
integer。 还 有 不 同 的 格式 可 供 选 择 ， 包 括 Hexadecimal Display,Signed Display( 有 符号 显示 )， 
和 Unsigned Display (无 符号 显示 )。 图 4-9 显示 了 所 有 的 选项 。 





4.5.4 ”整数 数组 求 和 ER 
在 刚 开 始 编程 时 ， 几 乎 没有 任务 比 计算 数组 元 素 总 
和 更 常见 了 。 汇 编 语 言 实现 数组 求 和 步 又 如 下 : Boteinteger 
1 ) 指定 一 个 寄存 器 作 变 址 操作 数 ， 存 放 数组 地 址 。 es 
2 ) 循环 计数 器 初始 化 为 数组 的 长 度 。 Headecmal Daplay 
3 ) 指定 一 个 寄存 器 存放 累积 和 数 ， 并 赋值 为 0。 es 
4 ) 创建 标号 来 标记 循环 开始 的 地 方 。 
5 ) 在 循环 体内 ， 将 和 数 与 一 个 数组 元 素 相 加 。 ee 
6 ) 指向 下 一 个 数组 元 素 。 Unwcode Ten 
7) 用 LOOP 指令 重复 循环 。 i 
步骤 1 到 步骤 3 可 以 按照 任何 顺序 执行 。 下 面 的 短 peeluate Momatcaly 
程序 实现 对 一 个 16 位 整数 数组 求 和 。 ee 
;数组 求 和 (SumArray .asm) 4-9 ”调试 器 内 存 窗口 的 弹出 菜单 
ee flat,stdcall 
.Stack 4096 
ExitProcess proto,dwExitCode:dword 
.data 


intarray DWORD 10000h,20000h,30000h,40000h 


.Code 

main PROC 
mov edi,OFFSET intarray ;1: EDI=intarray 地 址 
mov ecx,LENGTHOF intarray ;2: 循环 计数 器 初始 化 
mov eax,0 ;3: sum=0 

L1: ;4: 标记 循环 开始 的 地 方 
add eax, [edi] ;5: 加 一 个 整数 
add edi,TYPE intarray ;6; 指向 下 一 个 元 素 
loop LI ;7: 重复 ,直到 ECX=0 
invoke ExitProcess,0 

main ENDP 

END main 

4.5.5 ”复制 字符 串 


程序 常常 要 将 大 块 数据 从 一 个 位 置 复制 到 另 一 个 位 置 。 这 些 数据 可 能 是 数组 或 字符 串 ， 
但 是 它们 可 以 包括 任何 类 型 的 对 象 。 现 在 看 看 在 汇编 语言 中 如 何 实现 这 种 操作 ， 用 循环 来 复 
制 一 个 字符 串 ， 而 字符 串 表示 为 带 有 一 个 空 终 止 值 的 字 节 数组 。 变 址 寻 址 很 适合 于 这 种 操 
作 ， 因 为 可 以 用 同一 个 变 址 寄存 器 来 引用 两 个 字符 串 。 目 标 字符 串 必须 有 足够 的 空间 来 接收 
被 复制 的 字符 ， 包 括 最 后 的 空 字 节 : 

; 复制 字符 囊 (CopyStr .asm) 


-386 
.model flat,stdcall 


5 


数据 化 送 、 时 第 和 摹 尖 和 运 靖 


.Stack 4096 
ExitProcess proto,dwExitCode:dword 


.data 


source BYTE 


"This is the source string",0 


target BYTE SIZEOF source DUP(0) 


-code 
main PROC 
mov 
mov 
Ll: 
mov 
mov 
irie 


esi,0 
ecx, SIZEOF source 


al,Ssource[esil 
target [esi],al 
esi 


loop LI 


invoke ExitProcess,0 


main ENDP 


END main 


; 变 址 青 存 器 

; 循环 计数 器 

; 从 源 字符 囊 获 取 一 个 字符 
; 保存 到 目标 字符 囊 

; 指向 下 一 个 字符 

; 重复 ， 直 到 整个 字符 串 完 成 


MOYV 指令 不 能 同时 有 两 个 内 存 操作 数 ， 所 以 ， 每 个 源 字符 串 字 符 送 入 AL， 然 后 再 从 
AL 送信 目标 字符 串 。 


4.5.6 ”本 节 回 顾 
1.( 真 / 假 ): JMP 指令 只 能 跳 转 到 当前 过 程 中 的 标号 。 


2.( 真 / 假 ): JMP 是 条 件 跳 转 指令 。 


3. 循环 开始 时 ， 如 果 ECX 初始 化 为 0, 那么 LOOP 指令 要 循环 多 少 次 ? (假设 在 循环 中 ， 没 
有 其 他 指令 修改 ECX。) 

4.( 真 / 假 ): LOOP 指令 首先 检查 ECX 是 否 等 于 0， 然后 ECX 减 1， 再 跳 转 到 目标 标号 。 

5. ( 真 / 假 ) : LOOP 指令 执行 过 程 如 下 : ECX 减 1 ; 如 果 ECX 不 等 于 0，LOOP 跳 转 到 目标 


标号 。 


6. 实地 址 模式 中 ，LOOP 指令 使 用 哪 一 个 寄存 器 作 计数 器 ? 

7. 实地 址 模式 中 ，LOOPD 指令 使 用 哪 一 个 寄存 器 作 计 数 器 ? 

8.( 真 / 假 ): LOOP 指令 的 跳 转 目标 必须 在 距离 当前 地 址 256 个 字 节 的 范围 内 。 
9.( 挑 战 ): 程序 如 下 所 示 ，EAX 最 后 的 值 是 多 少 ? 


mov eax,0 


mov ”ecx,10 ;外 层 循环 计数 器 
EL1s 

mov eax,3 

mov ecx,5  ; 内 层 循环 计数 器 
L2， 

adQd eax, 5 

loop L2 ; 重复 内 层 循环 

loop L1 ; 重复 外 层 循环 


10. 修改 上 题 代码 ， 使 得 内 层 循环 开始 时 ， 外 层 循 环 计数 器 不 会 被 擦 除 。 
4.6 64 位 编程 


4.6.1 MOYV 指令 
64 位 模式 下 的 MOV 指令 与 32 位 模式 下 的 有 很 多 共同 点 ， 只 有 几 点 区 别 ， 现 在 讨论 一 
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下 。 立 即 操作 数 (常数 ) 可 以 是 8 位 、16 位 、32 位 或 64 位。 下 面 为 一 个 64 位 示例 : 


mov ”rax,0ABCDEFOAFFFFFFFFh ;64 位 立即 操作 数 


当 一 个 32 位 常数 送 入 64 位 寄存 器 时 ， 目 标 操 作 数 的 高 32 位 (位 32 一 位 63 ) 被 清除 
(等 于 0 ): 


mov rax, OFFFFFFFFh ; rax = 00000000FFFFFFFF 


向 64 位 寄存 器 送 入 16 位 或 8 位 常数 ， 其 高 位 也 要 清 零 : 


mov rax,06666h ; 清 位 16 一 位 63 
mov rax, 055h ; 清 位 8 一 位 63 


如 果 将 内 存 操 作 数 送 入 64 位 寄存 器 ， 则 结果 是 确定 的 。 比 如 ， 传 送 一 个 32 位 内 存 操作 
数 到 EAX (RAX 寄存 器 的 低 半 部 分 )， 就 会 清除 RAX 的 高 32 位 : 


.data 

myDword DWORD 80000000h 

.code 

mov rax, OFFFFFFFFFFFFFFFFh 

mov eax,myDword ; RAX = 0000000080000000 


但 是 ， 如 果 是 将 8 位 或 16 位 内 存 操 作 数 送 入 RAX 的 低位 ， 那么， 目标 寄存 器 的 高 位 不 
受 影响 : 


.data 

myByte BYTE 55h 

myWord WORD 6666h 

.code 

mov ”ax,myWord ;位 16 一 位 63 不 受 影 响 

mov ”al,myByte ;位 8 一 位 63 不 受 影响 

MOVSXD 指令 (符号 扩展 传送 ) 允许 源 操作 数 为 32 位 寄存 器 或 内 存 操作 数 。 下 面 的 指 
令 使 得 RAX 的 值 为 FFFFFFFFFFFFFFFFh: 

mov ebx, OFFFFFFFFh 

movsxd rax,ebx 

OFFSET 运算 符 产 生 64 位 地 址 ， 必 须 用 64 位 寄存 器 或 变量 来 保存 。 下 例 中 使 用 的 是 
RSI 寄存 器 : 


.data 

myArray WORD 10,20,30,40 

pet myArray 

64 位 模式 中 ，LOOP 指令 用 RCX 作为 循环 计数 器 。 

有 了 这 些 基本 概念 ， 就 可 以 编写 许多 64 位 模式 程序 了 。 大 多 数 情况 下 ， 如 果 一 直 使 用 
64 位 整数 变量 或 64 位 寄存 器 ， 那 么 编程 比较 容易 。ASCII 码 字符 串 是 一 种 特殊 情况 ， 因 为 
它们 总 是 包含 字 节 。 一 般 在 处 理 时 ， 采 用 间接 或 变 址 寻 址 。 


4.6.2 64 位 的 SumArray 程序 


现在 ， 在 64 位 模式 下 重 写 SumArray 程序 ， 计 算 64 位 整数 数组 的 总 和 。 首 先 ， 用 
QWORD 伪 指 令 定义 一 个 四 字数 组 ， 然 后 ， 将 所 有 32 位 寄存 器 名 更 换 为 64 位 寄存 器 名 。 完 
整 的 程序 清单 如 下 所 示 : 


发 据 修 送 、 录 赴 和 和 章 大 运 章 101 


; 数组 求 和 (SumArray_64.asm) 

ExitProcess PROTO 

.data 

intarray QWORD 1000000000000h,2000000000000h 
QWORD 3000000000000h,4000000000000h 


.Code 

main PROC 
mov rdi,OFFSET intarray ;RDI=intarray 地 址 
mov rcx,LENGTHOF intarray ;循环 计数 器 初始 化 
mov rax,0 ;sum=0 

L1: ; 标记 循环 开始 的 地 方 
add rax, [rdi] ; 加 一 个 整数 
add rdi,TYPE intarray ; 指向 下 一 个 元 素 
loop LI ; 重复 ， 直 到 RCX=0 
mov ecx,0 ;ExitProcess 返回 数值 
call ExitProcess 

main ENDP 

END 


4.6.3 ”加 法 和 减法 


如 同 32 位 模式 下 一 样 ，ADD、SUB、INC 和 DEC 指令 在 64 位 模式 下 ， 也 会 影响 CPU 
状态 标志 位 。 在 下 面 的 例子 中 ，RAX 寄存 器 存放 一 个 32 位 数 ， 执 行 加 1， 每 一 位 都 向 左 产 
生 一 个 进位 ， 因 此 ， 在 位 32 生成 1: 


mov rax,OFFFFFFFFh ;? 低 32 位 是 全 1 
add rax,l ; RAX = 100000000h 


需要 时 刻 留意 操作 数 的 大 小 ， 当 操作 数 只 使 用 部 分 寄存 器 时 ， 要 注意 寄存 器 的 其 他 部 分 
是 没有 被 修改 的 。 如 下 例 所 示 ，AX 中 的 16 位 总 和 翻转 为 全 0， 但 是 不 影响 RAX 的 高 位 。 
这 是 因为 该 操作 只 使 用 16 位 寄存 器 (AX 和 BX): 


mov rax,OFFFFh 
mov bx,l 


add ax,bx ; RAX = 0000000000000000 


同样 ， 在 下 面 的 例子 中 ， 由 于 AL 中 的 进位 不 会 进入 RAX 的 其 他 位 ， 所 以 执行 ADD 指 
今后 ，RAX 等 于 0: 


; RAX = 000000000000FFFF 


mov rax,0FFh ; RAX = 00000000000000FF 
mo DLL 
add al,bl ; RAX = 0000000000000000 


减法 也 使 用 相同 的 原则 。 在 下 面 的 代码 段 中 ，EAX 内 容 为 0， 对 其 进行 减 1 操作 ， 将 会 
使 得 RAX 低 32 位 变 为 -1 (FFFFFFFFh)。 同 样 ，AX 内 容 为 0， 对 其 进行 减 1 操作 ， 使 得 
RAX 低 16 位 等 于 -1 (FFFFh)。 


mov rax,0 ; RAX = 0000000000000000 
mov ebx,l1 

sub eax,ebx ; RAX = 00000000FFFFFFFF 
mov rax,0 ; RAX = 0000000000000000 
mov bx,l 

sub ax,bx ; RAX = 000000000000FFFF 


当 指 令 包 含 间接 操作 数 时 ， 必 须 使 用 64 位 通用 寄存 器 。 记 住 ,一 定 要 使 用 PTR 运算 符 
来 明确 目标 操作 数 的 大 小 。 下 面 是 一 些 包 含 了 64 位 目标 操作 数 的 例子 : 
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dec BYTE PTR [rdi] ;8 位 目标 操作 数 
inc WORD PTR [rbx] ;16 位 目标 操作 数 
inc QWORD PTR [rsi] ;64 位 目标 操作 数 


64 位 模式 下 ， 可 以 对 间接 操作 数 使 用 比例 因子 ， 就 像 在 32 位 模式 下 一 样 。 如 下 例 所 
示 ， 如 果 处 理 的 是 64 位 整数 数组 ， 比 例 因子 就 是 8: 


.data 

array QWORD 1,2,3,4 

.code 

mov esi,3 ; 下 标 
mov rax,array [rsi*8] ; RAX = 4 


64 位 模式 的 指针 变量 包含 的 是 64 位 偏 移 量 。 在 下 面 的 例子 中 ，ptrB 变量 包含 了 数组 B 
的 偏 移 量 : 


.data 
arrayB BYTE 10h,20h,30h,40h 
ptrB QWORD arrayB 


或 者 ， 还 可 以 用 OFFSET 运算 符 来 定义 ptrB， 使 得 这 个 关系 更 加 明确 : 


PtrB QWORD OFFSET arrayB 


4.6.4 本 节 回 顾 


1.( 真 / 假 ): 将 常数 值 OFFh 送 入 RAX 寄存 器 ， 将 清除 其 位 8 一 位 63。 
2.( 真 / 假 ): 一 个 32 位 常数 可 以 被 送 入 64 位 寄存 器 中 ,但 是 64 位 常数 不 可 以 。 
3. 执行 下 列 指 令 后 ，RCX 的 值 是 多 少 ? 
mov rcx,1234567800000000h 
sub ecx,l 
4. 执行 下 列 指令 后 ，RCX 的 值 是 多 少 ? 
mov rcx,1234567800000000h 
add rcx,0ABABABABh 
5. 执行 下 列 指令 后 ，AL 寄存 器 的 值 是 多 少 ? 


.data 

bArray BYTE 10h,20h,30h,40h,50h 
.Code 

mov rdi,OFFSET bArray 

dec BYTE PTR [rdi+1] 

lne vat 

mov al, [rdil] 


6. 执行 下 列 指令 后 ，RCX 的 值 是 多 少 ? 


mov rcx,0DFFFh 
mov bx,3 
add cx,bx 


4.7 本章 小 结 


MOV， 数 据 传送 指令 ， 将 源 操作 数 复制 到 目的 操作 数 。MOVZX 指令 将 一 个 较 小 的 操 
作 数 零 扩 展 为 较 大 的 操作 数 。MOVSX 指令 将 一 个 较 小 的 操作 数 符号 扩展 为 较 大 的 操作 数 。 
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XCHG 指令 交换 两 个 操作 数 的 内 容 ， 指 令 中 至 少 有 一 个 操作 数 是 寄存 器 。 
操作 数 类 型 ”本 章 中 出 现 了 下 列 操作 数 类 型 : 
e 直接 操作 数 是 变量 的 名 字 ， 表 示 该 变量 的 地 址 。 
@ 直接 - 偏 移 量 操作 数 是 在 变量 名 上 加 位 移 ， 生 成 新 的 偏 移 量 。 可 以 用 它 来 访问 内 存 
数据 。 
e 间接 操作 数 是 寄存 器 ， 其 中 存放 了 数据 地 址 。 通 过 在 寄存 器 名 外 面 加 方 括 号 (如 
[esi] )， 程 序 就 能 解析 该 地 址 ， 并 检索 内 存 数据 。 
e 变 址 操作 数 将 间接 操作 数 与 常数 组 合 在 一 起 。 常 数 与 寄存 器 值 相 加 ， 并 解析 结果 偏 
移 量 。 如 ，[array+esi] 和 [esi] 都 是 变 址 操作 数 。 
下 面 列 出 了 重要 的 算术 运算 指令 : 
e INC 指令 实现 操作 数 加 1。 
e DEC 指令 实现 操作 数 减 1。 
e ADD 指令 实现 源 操作 数 与 目的 操作 数 相 加 。 
e SUB 指令 实现 目的 操作 数 减 去 源 操作 数 。 
e NEG 指令 实现 操作 数 符 号 翻转 。 
当 把 简单 算术 运算 表达 式 转换 为 汇编 语言 时 ， 利 用 标准 运算 符 优先 级 原则 来 选择 首先 实 
现 哪个 表达 式 。 
状态 标志 ”下面 列 出 了 受 算术 运算 操作 影响 的 CPU 状态 标志 : 
e 算术 运算 操作 结果 为 负 时 ， 符 号 标志 位 置 1。 
e 与 目标 操作 数 相 比 ， 无 符号 算术 运算 操作 结果 太 大 时 ， 进 位 标志 位 置 1。 
e 执行 算术 或 布尔 指令 后 ， 奇 偶 标 志 位 能 立即 反映 出 目标 操作 数 最 低 有 效 字 节 中 1 的 
个 数 是 奇数 还 是 偶数 。 
e 目标 操作 数 的 位 3 有 进位 或 借 位 时 ， 辅 助 进位 标志 位 置 1。 
e 算术 操作 结果 为 0 时 ， 零 标志 位 置 1。 
e 有 符号 算术 运算 操作 结果 超过 目标 操作 数 范围 时 ， 滋 出 标志 位 置 1。 
运算 符 ”下面 列 出 了 汇编 语言 中 常用 的 运算 符 : 
OFFSET 运算 符 返 回 的 是 变量 与 其 所 在 段 首 地 址 的 距离 ( 按 字 节 计 )。 
PTR 运算 符 重新 定义 变量 的 大 小 。 
TYPE 运算 符 返回 的 是 单个 变量 或 数组 中 单个 元 素 的 大 小 〈 按 字 节 计 )。 
LENGTHOF 运算 符 返回 的 是 ， 数 组 元 素 的 个 数 。 
SIZEOF 运算 符 返 回 的 是 ， 数 组 初始 化 的 字 节 数 。 
e TYPEDEF 运算 符 创 建 用 户 定义 类 型 。 
循环 ”JMP( 跳 转 ) 指令 无 条 件 分 支 到 另 一 个 位 置 。LOOP( 按 ECX 计数 器 内 容 进行 循环 ) 
指令 用 于 计数 型 循环 。32 位 模式 下 ，LOOP 用 ECX 作 计 数 器 ; 64 位 模式 下 ， 用 RCX 作 计 
数 器 。 两 种 模式 下 ，LOOPD 用 ECX 作 计 数 器 ; LOOPW 用 CX 作 计 数 器 。 
MOYV 指令 的 操作 在 32 位 模式 和 64 位 模式 下 几乎 相同 。 但 是 ， 向 64 位 寄存 器 送 常数 和 
内 存 操 作 数 则 有 点 棘手 。 只 要 有 可 能 ,在 64 位 模式 下 尽量 使 用 64 位 操作 数 ， 间 接 操作 数 和 
变 址 操作 数 也 总 是 使 用 64 位 寄存 器 。 
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4.8 关键 术语 

4.8.1 术语 

Auxiliary Carry flag 辅助 进位 标志 
Carry flag 进位 标志 


conditional transfer 有 条 件 转移 

data transfer instruction 数据 传送 指令 
direct memory operand 直接 内 存 操作 数 
direct-offset operand 直接 - 偏 移 量 操作 数 
effective address (有 效 地 址 ) 

immediate operand (立即 操作 数 ) 

indexed operand 变 址 操作 数 

indirect operand 间接 操作 数 


4.8.2 指令、 运算 符 和 伪 指令 


ADD 
ALIGN 
DEC 
INC 
MOVSX 
MOVZX 
NEG 
LABEL 
LAHF 
LENGTHOF 
OFFSET 


4.9 复习 题 和 练习 
4.9.1 简 答题 
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memory operand (内 存 操作 数 ) 
Overflow flag (溢出 标志 ) 

Parity flag (奇偶 标志 ) 

pointer (指针 ) 

register operand (寄存 器 操作 数 ) 
scale factor (比例 因子 ) 

sign extension (符号 扩展 ) 
unconditional transfer (无 条 件 转移 ) 
zero extension ( 零 扩 展 ) 

Zero flag( 零 标志 ) 


SAHF 
SIZEOF 
SUB 
TYEE 
TYPEDEF 
XCHG 


1. 执行 下 列 标记 为 (a) 和 (b) 的 指令 后 ，EDX 的 值 分 别 为 多 少 ? 


.data 

one WORD 8002h 

two WORD 4321h 
.Code 

mov edx,21348041h 
movsx edx,one 
movsx edx,two 


2. 执行 下 列 指令 后 ，EAX 的 值 是 多 少 ? 


mov eax,1002FFFFh 
inc ax 


3. 执行 下 列 指 令 后 ，EAX 的 值 是 多 少 ? 


mov eax,30020000h 
dec ax 
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4. 执行 下 列 指令 后 ，EAX 的 值 是 多 少 ? 


mov eax,1002FFFFh 


neg ax 

5. 执行 下 列 指令 后 ， 奇 偶 标 志 位 的 值 是 多 少 ? 
mov al,l 
add al,3 


6. 执行 下 列 指令 后 ，EAX 和 符号 标志 位 的 值 分 别 是 多 少 ? 


mov eax,5 
sub eax,6 


7. 下 面 的 代码 中 ,AL 为 一 字 节 有 符号 数 。 说 明 ， 在 判断 AL 最 终结 果 是 否 在 有 符号 数 的 有 效 范围 内 时 ， 


溢出 标志 位 是 否 有 用 ， 若 有 用 ， 是 如 何 起 作用 的 ? 


mov al,-1 
add al,130 


8. 执行 下 列 指 令 后 ，RAX 的 值 是 多 少 ? 


mov rax,44445555h 

9. 执行 下 列 指令 后 ，RAX 的 值 是 多 少 ? 
.data 
dwordVal DWORD 84326732h 
.Code 


mov rax,OFFFFFFFFO0000000h 
mov rax,dwordVal 


10. 执行 下 列 指令 后 ，EAX 的 值 是 多 少 ? 


.data 

dvVal DWORD 12345678h 
.Code 

mov ax,3 

mov WORD PTR dVal+2,ax 
mov eax,dval 


11. 执行 下 列 指令 后 ，EAX 的 值 是 多 少 ? 


.data 

.dVal DWORD ? 

.code 

mov dVal,12345678h 
mov ax,WORD PTR dVal+2 
add ax,3 

mov WORD PTR dVal,ax 
mov eax,dVal 


12.( 是 / 否 ): 正 数 与 负数 相 加 时 ， 是 否 可 能 使 溢出 标志 位 置 1 ? 
13.( 是 / 否 ): 两 负数 相 加 .结果 为 正 数 ， 溢 出 标志 位 是 否 置 1 ? 
14.( 是 / 否 ): 执行 NEG 指令 是 否 能 将 溢出 标志 位 置 1? 

15.( 是 / 否 ): 符号 标志 位 和 零 标 志 位 是 否 能 同时 置 1 ? 

问题 16 一 问题 19 使 用 如 下 变量 定义 : 


.data 

varl SBYTE -4,-2,3,1 

var2 WORD 1000h,2000h,3000h,4000h 
var3 SWORD -16,-42 

var4 DWORD 1,2,3,4,5 


16. 判断 下 述 每 条 指令 是 否 为 有 效 指令 : 
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IOV ax,vVvarl? 
InOV ax Var2 
mov eax, var3 
Var2,var3 
movzx ax,var2 
movzx var2,al 
mov ds,ax 

mov ds,1000h 


17. 顺序 执行 下 列 指 令 ， 则 每 条 指令 目标 操作 数 的 十 六 进 制 值 是 多 少 ? 


mov al,varl > 
mov ah, [varl+3] yD, 


.顺序 执行 下 列 指令 ， 则 每 条 指令 目标 操作 数 的 值 是 多 少 ? 


mov ax,var2 
mov ax, [var2+4] 
mov ax,var3 
mov ax, [var3-2] 


人 
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oo 
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19. 顺序 执行 下 列 指令 ， 则 每 条 指令 目标 操作 数 的 值 是 多 少 ? 
mov edx,var4 六 
movzx edx,var2 
mov edx, [var4+4] ds 
movsx edx,varl :2 
4.9.2 ”算法 基础 


1. 有 一 变量 名 为 three 的 双 字 变量 编写 一 组 MOV 指令 来 交换 该 变量 的 高 位 字 和 低位 字 。 

2. 用 不 超过 3 条 的 XCHG 指令 对 4 个 8 位 寄存 器 的 值 进行 重 排序 ， 将 其 顺序 从 A、B、C.、D 调整 为 B、 
Ge .i 

3. 被 传输 的 信息 通常 包含 有 一 个 奇偶 位 ， 其 值 与 数据 字 节 结合 在 一 起 ， 使 得 1 的 位 数 为 偶数 。 设 AL 
寄存 器 中 信息 字 节 的 值 为 0111 0101， 如 何 用 一 条 算术 运算 指令 和 奇偶 标志 位 判断 该 信息 字 节 是 偶 
校 验 还 是 奇 校 验 ? 

4. 编写 代码 ， 用 字 节 操作 数 实现 两 个 负 整 数 相 加 ， 并 使 溢出 标志 位 置 1。 

5. 编写 连续 的 两 条 指令 ， 用 加 法 使 零 标 志 位 和 进位 标志 位 同时 置 1。 

6. 编写 连续 的 两 条 指令 ， 用 减法 使 进位 标志 位 置 1。 

7. 用 汇编 语言 实现 算术 表达 式 : EAX=-val2+7 一 val3+vall。 假 设 vall 、val2 和 val3 都 是 32 位 整数 变量 。 

8. 编写 循环 代码 ， 在 一 个 双 字 数组 中 进行 迭代 。 用 带 比例 因子 的 变 址 寻 址 ， 计 算 该 数组 元 素 的 总 和 。 

9. 用 汇编 语言 实现 算术 表达 式 : AX= (val2+BX) -val4。 假 设 val2 和 val4 都 是 16 位 整数 变量 。 

10. 编写 连续 的 两 条 指令 ,使 进位 标志 位 和 溢出 标志 位 同时 置 1。 

11. 编写 指令 序列 ， 说 明 在 执行 INC 和 DEC 指令 后 ， 如 何 用 零 标 志 位 来 判断 无 符号 溢出 情况 。 

问题 12 一 问题 18 使 用 如 下 数据 定义 : 


.data 

myBytes BYTE 10h,20h,30h,40h 
myWords WORD 3 DUP(?),2000h 
myString BYTE "ABCDE" 


12. 在 给 定数 据 中 插入 一 条 伪 指 令 ， 将 myBytes 对 齐 到 偶 地 址 。 
13. 下 列 每 条 指令 执行 后 ，EAX 的 值 分 别 是 多 少 ? 


mov eax,TYPE myBytes 六 
mov eax,LDENGTHOF myBytes ;DD 
mov eax,SIZEOF myBytes $s 
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mov eax,TYPE myWords 
mov eax,LENGTHOF myWords 
mov eax,SIZEOF myWords 
mov eax,SIZEOF myString 
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14. 编写 一 条 指令 将 myBytes 的 前 两 个 字 节 送 入 DX 寄存 器 ， 使 寄存 器 的 值 为 2010h。 
15. 编写 一 条 指令 将 myWords 的 第 二 个 字 节 送 入 AL 寄存 器 。 

16. 编写 一 条 指令 将 myBytes 的 全 部 四 个 字 节 送 人 EAX 寄存 器 。 

17. 在 给 定数 据 中 插 人 一 条 LABEL 伪 指 令 ， 使 得 myWords 能 直接 送 入 32 位 寄存 器 。 
18. 在 给 定数 据 中 插 人 一 条 LABEL 伪 指 令 ， 使 得 myBytes 能 直接 送 人 16 位 寄存 器 。 


4.10 ”编程 练习 


下 面 的 练习 可 以 在 32 位 模式 或 64 位 模式 下 完成 。 
*1. 将 大 端 顺 序 转换 为 小 端 顺序 
使 用 下 面 的 变量 和 MOYV 指令 编写 程序 ， 将 数值 从 大 端 顺 序 复 制 为 小 端 顺 序 ， 颠 倒 字 节 的 顺 
序 。32 位 数 的 十 六 进 制 值 为 12345678。 
.data 
bigEndian BYTE 12h,34h,56h,78h 
littleEndian DWORD? 
** 2. 交换 数组 元 素 对 
编写 循环 程序 ， 用 变 址 寻 址 交换 数组 中 的 数值 对 ， 每 对 中 包含 偶数 个 元 素 。 即 ， 元 素 i 与 元 素 
计 ! 交换 ， 元 素 i+2 与 元 素 i+3 交换 ， 以 此 类 推 。 
** 3. 数组 元 素 间 隔 之 和 
编写 循环 程序 ， 用 变 址 寻 址 计算 连续 数组 元 素 的 间隔 总 和 。 数 组 元 素 为 双 字 ， 按 非 递减 次 序 
排列 。 比 如 ， 数 组 为 {0，2，5，9，10}， 则 元 素 间 隔 为 2、3、4 和 1， 那么 间隔 之 和 等 于 10。 
**4. 将 字数 组 复制 到 双 字 数组 
编写 循环 程序 ， 把 一 个 无 符号 字 ( 16 位 ) 数组 的 所 有 元 素 复制 到 无 符号 双 字 ( 32 位 ) 数组 。 
xx 5. 斐 波 那 契 数列 
编写 循环 程序 ， 计 算 斐 波 那 契 (Fibonacci) 数列 前 七 个 数值 之 和 ， 算式 如 下 : 
Fib(1)= 1, Fib(2) = 1, Fib(n)= Fib(n—1)+Fib(n—2) 
*** 6. 数组 反 向 
编写 循环 程序 ， 用 间接 或 变 址 寻 址 实现 整数 数组 元 素 的 位 置 颠倒 。 不 能 将 元 素 复制 到 其 他 数 
组 。 考 虑 到 数值 大 小 和 类 型 在 将 来 可 能 发 生变 化 , 用 SIZEOF、TYPE 和 LENGTHOF 运算 符 尽 可 
能 增加 程序 的 灵活 性 。 
*** 7. 将 字符 串 复制 为 相反 顺序 
编写 循环 程序 ， 用 变 址 寻 址 将 一 个 字符 串 从 源 复 制 到 目的 ， 并 实现 字符 的 反 向 排序 。 变 量 定 
义 如 下 : 
source BYTE "This is the source string",0 
target BYTE SIZEOF source DUP('#') 
*#*# 8. 数组 元 素 移 位 ; 
编写 循环 程序 ， 用 变 址 寻 址 把 一 个 32 位 整数 数组 中 的 元 素 向 前 (向 右 ) 循环 移动 一 个 位 置 ， 
数组 最 后 一 个 元 素 的 值 移动 到 第 一 个 位 置 上 。 比 如 ， 数 组 [10，20，30，40] 移 位 后 转换 为 [40， 
10，20，30]。 
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过 程 


本 章 介绍 过 程 ， 也 称 为 子 程序 或 函数 。 任 何 具有 一 定 规模 的 程序 都 需要 被 划分 为 几 个 部 
分 ， 其 中 某 些 部 分 要 被 使 用 多 次 。 读 者 会 发 现 寄存 器 可 以 传递 参数 ， 也 将 了 解 为 了 追踪 过 程 
的 调用 位 置 ，CPU 使 用 的 运行 时 堆栈 。 最 后 ， 本 章 会 介绍 本 书 提供 的 两 个 代码 库 ， 分 别称 
为 Irvine 32 和 Irvine 64， 其 中 包含 了 有 用 的 工具 来 简化 输入 输出 。 


5.1 堆栈 操作 


如 下 图 所 示 ， 如 果 把 10 个 盘子 垒 起 来 ， 其 结果 就 称 为 堆栈 。 虽 然 有 可 能 从 这 个 堆栈 的 
中 间 移 出 一 个 盘子 ， 但 是 ， 更 普遍 的 是 从 项 端 移 除 。 新 的 盘子 可 以 释 加 到 堆栈 项 部， 但 不 能 
加 在 底部 或 中 部 (图 $-1 ): 

堆栈 数据 结构 (stack data structure) 的 原 
理 与 盘子 堆栈 相同 : 新 值 添加 到 栈 顶 ， 删 除 值 
也 在 栈 顶 移 除 。 通 常 ， 对 各 种 编程 应 用 来 说 ， 
堆栈 都 是 有 用 的 结构 ， 并 且 它 们 也 容易 用 面向 
对 象 的 编程 方法 来 实现 。 如 果 读 者 已 经 学 习 过 
使 用 数据 结构 的 编程 课程 ， 那 么 就 应 该 已 经 用 
过 堆栈 抽象 数据 类 型 (stack abstract data type)。 
堆栈 也 被 称 为 LIFO 结构 (后 进 先 出 ，Last-In 图 5-1 盘子 构成 的 堆栈 
First-Out)， 其 原因 是 ， 最 后 进入 堆栈 的 值 也 是 第 一 个 出 堆栈 的 值 。 

本 章 将 特别 关注 运行 时 堆栈 ( runtime stack)。 它 直接 由 CPU 的 硬件 支持 ， 是 过 程 调用 
与 返回 机 制 的 基本 部 分 。 大 部 分 情况 下 ， 本 章 称 它 为 堆栈 。 


5.1.1 运行 时 堆栈 ( 32 位 模式 ) 


运行 时 堆栈 是 内 存 数组 ，CPU 用 ESP (扩展 堆栈 指针 ，extended stack pointer) 寄存 器 
对 其 进行 直接 管理 ， 该 寄存 器 被 称 为 堆栈 指针 寄存 器 ( stack pointer register)。32 位 模式 下 ， 
ESP 寄存 器 存放 的 是 堆栈 中 某 个 位 置 的 32 位 偏 移 量 。ESP 基本 上 不 会 直接 被 程序 员 控 制 ， 
反之 , 它 是 用 CALL、RET、PUSH 和 POP 等 指令 间接 进行 修改 。 

ESP 总 是 指向 添加 ， 或 压 入 (pushed) 到 偏 移 量 
栈 顶 的 最 后 一 个 数值 。 为 了 便于 说 明 ， 假 设 现 0000 








00001000 用 < 一 ESP = 0000100h 
有 一 个 堆栈 ， 内 含 一 个 数值 。 如 图 5-2 所 示 ， ODOCOEhE | 
ESP 的 内 容 是 十 六 进 制 数 0000 1000， 即 刚 压 Se 


入 堆栈 数值 ( 0000 0006 ) 的 偏 移 量 。 在 图 中 ， dd 
当 堆 栈 指针 数值 减少 时 ， 栈 顶 也 随 之 下 移 。 | 

上 图 中 ， 每 个 堆栈 位 置 都 是 32 位 长 ， 这 00 = 
是 32 位 模式 下 运行 程序 的 情形 。 图 5-2 包含 一 个 值 的 堆栈 
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这 里 讨论 的 运行 时 堆栈 与 数据 结构 课程 中 讨论 的 堆栈 抽象 数据 类 型 (ADT，stack 
abstract data type) 是 不 同 的 。 运 行 时 堆栈 工作 于 系统 层 ， 处 理子 程序 调用 。 堆 栈 ADT 


是 编程 结构 ， 通 常用 高 级 编程 语言 编写 ， 如 C++ 或 Java。 它 用 于 实现 基于 后 进 先 出 操作 
的 算法 。 
1. 入 栈 操作 
32 位 入 栈 操作 把 栈 顶 指针 减 4， 青 将 数值 复制 到 栈 顶 指针 指向 的 堆栈 位 置 。 图 5-3 展 
示 了 把 0000 00A5 压 和 人 堆栈 的 结果 ， 堆栈 中 已 经 有 一 个 数值 ( 0000 0006 )。 注 意 ，ESP 寄 
存 器 总 是 指向 最 后 压 人 堆栈 的 数据 项 。 图 中 显示 的 堆栈 顺序 与 之 前 示例 给 出 的 盘 堆 栈 顺序 
相反 ， 这 是 因为 运行 时 堆栈 在 内 存 中 是 向 下 生长 的 ， 即 从 高 地 址 向 低地 址 扩展 。 人 栈 之 前 ， 
ESP=0000 1000h ; 入 栈 之 后 ，ESP=0000 0FFCh。 图 5-4 显示 了 同一 个 堆栈 总 共 压 人 4 个 整 
数 之 后 的 情况 。 


ooo01000 | 
0o0000FFC | 





00000FFC 
O0000FF8 
00000FF4 
00000FF0 





图 5-4 压 入 数值 0000 0001 和 0000 0002 之 后 的 堆栈 


2. 出 栈 操作 
出 栈 操作 从 堆栈 删除 数据 。 数 值 弹出 堆栈 后 ， 栈 顶 指针 增加 ( 按 堆 栈 元 素 大 小 )， 指 向 
堆栈 中 下 一 个 最 高 位 置 。 图 5-5 展示 了 数值 0000 0002 弹出 前 后 的 堆栈 情况 。 


后 
00001000 | 000000 00001000 | O00000 
00000FFC | 00000FFC 靶 
o0000FF8 | 


00000FF4 | 0600 


00000FF8 | 
00000FF4 


00000FF0 00000FF0 





图 5-5 从 运行 时 堆栈 弹出 一 个 数值 
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ESP 之 下 的 堆栈 域 在 逻辑 上 是 空白 的 ， 当 前 程序 下 一 次 执行 任何 数值 人 栈 操作 指令 都 可 
以 覆盖 这 个 区 域 。 

3. 堆栈 应 用 

运行 时 堆栈 在 程序 中 有 一 些 重要 用 途 : 

e 当 寄 存 器 用 于 多 个 目的 时 ,堆栈 可 以 作为 寄存 器 的 一 个 方便 的 临时 保存 区 。 在 寄存 

器 被 修改 后 ， 还 可 以 恢复 其 初始 值 。 

e 执行 CALL 指令 时 ，CPU 在 堆栈 中 保存 当前 过 程 的 返回 地 址 。 

e 调用 过 程 时 ， 输 入 数值 也 被 称 为 参数 ， 通 过 将 其 压 人 堆栈 实现 参数 传递 。 

e 堆栈 也 为 过 程 局 部 变量 提供 了 临时 存储 区 域 。 


5.1.2 PUSH 和 POP 指令 

1. PUSH 指令 

PUSH 指令 首先 减少 ESP 的 值 ， 再 将 源 操作 数 复制 到 堆栈 。 操 作 数 是 16 位 的 ， 则 ESP 
减 2， 操 作 数 是 32 位 的 ， 则 ESP 减 4。PUSH 指令 有 3 种 格式 : 


PUSH reg memi16 
PUSH regq mem32 
PUSH imm32 


2. POP 指令 

POP 指令 首先 把 ESP 指向 的 堆栈 元 素 内 容 复制 到 一 个 16 位 或 32 位 目的 操作 数 中 ， 再 
增加 ESP 的 值 。 如 果 操 作 数 是 16 位 的 ，ESP 加 2， 如 果 操 作 数 是 32 位 的 ，ESP 加 4: 

POP req memlé6 

POP reg/mem3? 

3. PUSHFD 和 POPFD 指令 

PUSHFD 指令 把 32 位 EFLAGS 寄存 器 内 容 压 人 堆栈 ， 而 POPFD 指令 则 把 栈 顶 单元 内 
容 弹出 到 EFLAGS 寄存 器 : 

pushfd 

popfd 

不 能 用 MOYV 指令 把 标识 寄存 器 内 容 复制 给 一 个 变量 ， 因 此 ，PUSHFD 可 能 就 是 保存 标 
志 位 的 最 佳 途径 。 有 些 时 候 保存 标志 寄存 器 的 副本 是 非常 有 用 的 ， 这 样 之 后 就 可 以 恢复 标志 
寄存 器 原来 的 值 。 通 常会 用 PUSHFD 和 POPFD 封闭 一 段 代码 : 


pushfd ; 保存 标志 寄存 器 
;任意 语句 序列 
popta ; 恢复 标志 寄存 器 


当 用 这 种 方式 使 用 和 人 栈 和 出 栈 指令 时 ， 必 须 确 保 程序 的 执行 路 径 不 会 跳 过 POPFD 指 
令 。 当 程序 随 着 时 间 不 断 修改 时 ， 很 难 记 住所 有 人 栈 和 出 栈 指令 的 位 置 。 因 此 ， 精 确 的 文档 
就 显得 至 关 重 要 ! 

一 种 不 容易 出 错 的 保存 和 恢复 标识 寄存 器 的 方法 是 : 将 它们 压 人 堆栈 后 ， 立 即 弹出 给 一 
个 变量 : 

.data 

saveFlags DWORD ? 


pd ; 标识 寄存 器 内 容 入 槛 

pop saveFlags ; 复制 给 一 个 变量 

下 述 语句 从 同一 个 变量 中 恢复 标识 寄存 器 内 容 : 

push saveFlags ; 被 保存 的 标识 入 栈 

popfd ; 复制 给 标识 寄存 顺 

4. PUSHAD, PUSHA，POPAD 和 POPA 

PUSHAD 指令 按照 EAX、ECX、EDX、EBX、ESP (执行 PUSHAD 之 前 的 值 )、EBP、 
ESI 和 EDI 的 顺序 ， 将 所 有 32 位 通用 寄存 器 压 人 堆栈 。POPAD 指令 按照 相反 顺序 将 同样 的 
寄存 器 弹出 堆栈 。 与 之 相似 ，PUSHA 指令 按 序 (AX、CX、DX、BX、SP、BP、SI 和 DI) 
将 16 位 通用 寄存 器 压 人 堆栈 。POPA 指令 按照 相反 顺序 将 同样 的 寄存 器 弹出 堆栈 。 在 16 位 
模式 下 ， 只 能 使 用 PUSHA 和 POPA 指令 。16 位 编程 将 在 第 14 ~ 17 章 中 讨论 。 

如 果 编 写 的 过 程 会 修改 32 位 寄存 器 的 值 ， 则 在 过 程 开 始 时 使 用 PUSHAD 指令 ， 在 结束 
时 使 用 POPAD 指令 ， 以 此 保存 和 恢复 寄存 器 的 内 容 。 示 例如 下 列 代码 段 所 示 : 


MySub PROC 
pushad 时 保存 通用 寄存 器 的 内 容 
i eaxy.。. 
mov edx,... 
moOV eCcx,... 
po ; 恢复 通用 寄存 器 的 内 容 
MySub ENDP 


必须 要 指出 ， 上 述 示例 有 一 个 重要 的 例外 : 过 程 用 一 个 或 多 个 寄存 器 来 返回 结果 时 ， 不 
应 使 用 PUSHA 和 PUSHAD。 假 设 下 述 ReadValue 过 程 用 EAX 返回 一 个 整数 ; 调用 POPAD 
将 会 覆盖 EAX 中 的 返回 值 : 


ReadValue PROC 
pushad ; 保存 通用 寄存 器 的 内 容 


mov eax,return value 


popad ; 覆盖 EAX ! 
ret 
ReadValue ENDP 


示例 : 字符 串 反 转 

现在 查看 名 为 RevStr 的 程序 : 在 一 个 字符 串 上 循环 ， 将 每 个 字符 压 人 堆栈 ， 再 把 这 些 
字符 从 堆栈 中 弹出 (相反 顺序 )， 并 保存 回 同一 个 字符 串 变 量 。 由 于 堆栈 是 LIFO (后 进 先 出 ) 
结构 ， 字 符 串 中 的 字母 顺序 就 发 生 了 翻转 : 

; 字符 素 翻 转 (RevStE .asm) 


-386 

.model flat,stdcall 

.Stack 4096 

ExitProcess PROTO,dwExitCode:DWORD 
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.data 
aName BYTE "Rbraham Lincoln" ,0 
nameSize = ($ - aName) - 1 


.Code 

main PROC 

; 将 名 字 压 入 堆栈 
mov ecx,nameSize 
mov esi,0 


L1: movzx eax,aName[esi] ;获取 字符 
push eax ; 压 入 堆栈 
he esi 
loop Ll 

; 将 名 字 按 逆序 弹出 堆栈 ， 

; 并 存 入 aName 数组 
mOV ecx,nameSize 
mov esi,0 


L2: pop eax ; 获取 字符 
mov aName[esi],al ; 存 入 字符 囊 
inc esi 
loop L2 
INVOKE ExitProcess,0 

main ENDP 
END main 
5.1.3 ”本 节 回 顾 


1. 哪个 寄存 器 ( 32 位 模式 中 ) 管理 堆栈 ? 

2. 运行 时 堆栈 与 堆栈 抽象 数据 类 型 有 什么 不 同 ? 

3. 为 什么 堆栈 被 称 为 LIFO 结构 ? 

4. 当 一 个 32 位 数值 压 人 堆栈 时 ，ESP 发 生 了 什么 变化 ? 
5.( 真 / 假 ): 过 程 中 的 局 部 变量 是 在 堆栈 中 新 建 的 。 
6.( 真 / 假 ): PUSH 指令 不 能 用 立即 数 作 操作 数 。 


5.2 ”定义 并 使 用 过 程 


如 果 读 者 已 经 学 过 了 高 级 编程 语言 ， 那 么 就 会 知道 将 程序 分 割 为 子 过 程 〈subroutine) 是 
多 么 有 用 。 一 个 复杂 的 问题 常常 要 分 解 为 相互 独立 的 任务 ， 这 样 才 易 于 被 理解 、 实 现 以 及 有 
效 地 测试 。 在 汇编 语言 中 ， 通 常用 术语 过 程 (procedure) 来 指 代 子 程序 。 在 其 他 语言 中 ， 子 
程序 也 被 称 为 方法 或 函数 。 

就 面向 对 象 编程 而 言 ， 单 个 类 中 的 函数 或 方法 大 致 相当 于 封装 在 一 个 汇编 语言 模块 中 的 
过 程 和 数据 集合 。 汇 编 语言 出 现 的 时 间 远 早 于 面向 对 象 编程 ， 因 此 它 不 具备 面向 对 象 编程 中 
的 形式 化 结构 。 汇 编程 序 员 必 须 在 程序 中 实现 自己 的 形式 化 结构 。 


5.2.1 PROC 伪 指 令 


1. 定义 过 程 

过 程 可 以 非 正 式 地 定义 为 : 由 返回 语句 结束 的 已 命名 的 语句 块 。 过 程 用 PROC 和 ENDP 
伪 指 令 来 定义 ， 并且 必 须 为 其 分 配 一 个 名 字 (有 效 标识 符 )。 到 目前 为 止 ， 所 有 编写 的 程序 
都 包含 了 一 个 名 为 main 的 过 程 ， 例 如 : 
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main PROC 


main ENDP 


当 在 程序 启动 过 程 之 外 创建 一 个 过 程 时 ， 就 用 RET 指令 来 结束 它 。RET 强制 CPU 返回 
到 该 过 程 被 调用 的 位 置 : 

sample PROC 

ret 

sample ENDP 

2. 过 程 中 的 标号 

默认 情况 下 ， 标 号 只 在 其 被 定义 的 过 程 中 可 见 。 这 个 规则 常常 影响 到 跳 转 和 循环 指令 。 
在 下 面 的 例子 中 ， 名 为 Destination 的 标号 必须 与 JMP 指令 位 于 同一 个 过 程 中 : 


jmp Destination 


解决 这 个 限制 的 方法 是 定义 全 局 标号 ， 即 在 名 字 后 面 加 双 冒 号 ( : : ): 


Destination:: 


就 程序 设计 而 言 ， 跳 转 或 循环 到 当前 过 程 之 外 不 是 个 好 主意 。 过 程 用 自动 方式 返回 并 调 
整 运行 时 堆栈 。 如 果 直 接 跳出 一 个 过 程 ， 则 运行 时 堆栈 很 容易 被 损坏 。 关 于 运行 时 堆栈 的 更 
多 信息 请 参阅 8.2 节 。 

3. 示例 : 三 个 整数 求 和 

现在 创建 一 个 名 为 SumOf 的 过 程 计 算 三 个 32 位 整数 之 和 。 假 设 在 过 程 调用 之 前 ， 整 数 
已 经 分 配给 EAX、EBX 和 ECX。 过 程 用 EAX 返回 和 数 : 


SumOf PROC 
add eax,ebx 
add eax,ecx 
ret 

SumOf ENDP 


4. 过 程 说 明 
要 培养 的 一 个 好 习惯 是 为 程序 添加 清晰 可 读 的 说 明 。 下 面 是 对 放 在 每 个 过 程 开 头 的 信息 
的 一 些 建议 : 

e 对 过 程 实现 的 所 有 任务 的 描述 。 

e 输入 参数 及 其 用 法 的 列表 ， 并 将 其 命名 为 Receives (接收 )。 如 果 输 入 参数 对 其 数值 
有 特殊 要 求 ， 也 要 在 这 里 列 出 来 。 

e 对 过 程 返 回 的 所 有 数值 的 描述 ， 并 将 其 命名 为 Returns (返回 )。 

e 所 有 特殊 要 求 的 列表 ， 这 些 要 求 被 称 为 先决 条 件 (preconditions)， 必 须 在 过 程 被 调用 
之 前 满足 。 列 表 命 名 为 Requires。 例 如 ， 对 一 个 画图 形 线条 的 过 程 来 说 ,一 个 有 用 的 
先决 条 件 是 该 视频 显示 适配器 必须 已 经 处 于 图 形 模式 。 


上 述 选 择 的 描述 性 标号 ， 如 Receives、Returns 和 Requires， 不 是 绝对 的 ; 其 他 有 用 





的 名 字 也 常常 被 使 用 。 
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146 有 了 这 些 思想 ， 现 在 对 SumOf 过 程 添加 合适 的 说 明 : 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


; 计算 3 个 32 位 整数 之 和 并 返回 和 数 。 
;? 接收 : EAX、EBX 和 ECX 为 3 个 整数 ， 可 能 是 有 符号 数 ， 也 可 能 是 无 符号 数 。 
; 返回: EAX= 和 数 


SumOf PROC 
add eax,ebx 
add eax,ecx 
ret 

SumOf ENDP 


用 高 级 语言 ， 如 C 和 C++， 编 写 的 函数 ， 通 常用 AL 返回 8 位 的 值 ， 用 AX 返回 16 位 
的 值 ， 用 EAX 返回 32 位 的 值 。 


5.2.2 ”CALL 和 RET 指令 


CALL 指令 调用 一 个 过 程 ， 指 挥 处 理 器 从 新 的 内 存 地 址 开始 执行 。 过 程 使 用 RET (从 过 
程 返回 ) 指令 将 处 理 器 转 回 到 该 过 程 被 调用 的 程序 点 上 。 从 物理 上 来 说 ，CALL 指令 将 其 返 
回 地 址 压 人 堆栈 ， 再 把 被 调用 过 程 的 地 址 复制 到 指令 指针 寄存 器 。 当 过 程 准 备 返回 时 ， 它 的 
RET 指令 从 堆栈 把 返回 地 址 弹 回 到 指令 指针 寄存 器 。32 位 模式 下 ,CPU 执行 的 指令 由 EIP( 指 
令 指 针 寄 存 器 ) 在 内 存 中 指出 。16 位 模式 下 ， 由 IP 指出 指令 。 

调用 和 返回 示例 

假设 在 main 过 程 中 ，CALL 指令 位 于 偏 移 量 为 0000 0020 处 。 通 常 ， 这 条 指令 需要 5 个 
字 节 的 机 器 码 ， 因 此 ， 下 一 条 语句 (本 例 中 为 一 条 MOYV 指令 ) 就 位 于 偏 移 量 为 0000 0025 处 : 


main PROC 
00000020 call MySub 
00000025 mov eax,ebx 


然后 ,假设 MySub 过 程 中 第 一 条 可 执行 指令 位 于 偏 移 量 0000 0040 处 : 


MySub PROC 
00000040 mov eax,edx 


i ENDP 
当 CALL 指令 执行 时 (图 5-6 )， 调 用 之 后 的 地 址 ( 0000 0025 ) 被 压 人 堆栈 ，MySub 的 
地 址 加 载 到 EIP。 执 行 MySub 中 的 全 部 指令 直到 RET 指令 。 当 执行 RET 指令 时 ，ESP 指向 
的 堆栈 数值 被 弹出 到 EIP (图 5-7， 步骤 1 )。 在 步骤 2 中 ，ESP 的 数值 增加 ， 从 而 指向 堆栈 
中 的 前 一 个 值 (步骤 2 )。 





CT 


5-6 ”执行 一 条 CALL 指令 


位 
沿 
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EIP 


00000025 | 





图 5-7 执行 RET 指令 


5.2.3 ”过 程 调用 贱 套 


被 调用 过 程 在 返回 之 前 又 调用 了 男 一 个 过 程 时 ， 就 发 生 了 过 程 调用 嵌 套 。 假 设 main 
调用 了 过 程 Subl1。 当 Subl 执行 时 ， 它 调用 了 过 程 Sub2。 当 Sub2 执行 时 ， 它 调用 了 过 程 
Sub3。 步 又 如 图 5-8 所 示 。 


main proc 


call Subl 
exit 
main endp 


Subl proc 


call Sub2 
ret 


Subl endp 


Sub2 proc 


call Sub3 
ret 


Sub2 endp 


Sub3 proc 


rel 


Sub3 endp 
图 5-8 ”过 程 调用 栋 套 
当 执 行 Sub3 末尾 的 RET 指令 时 ,将 stack[ESP] (堆栈 段 首 地 址 +ESP 给 出 的 偏 移 量 ) 


中 的 数值 弹出 到 指令 指针 寄存 器 中 ， 这 使 得 执行 转 回 到 调用 Sub3 后 面 的 指令 。 下 图 显示 的 
是 执行 从 Sub3 返回 操作 之 前 的 堆栈 : 
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ww 
志 





SEE 


返回 之 后 ，ESP 指向 栈 项 下 一 个 元 素 。 当 Sub2 末尾 的 RET 指令 将 要 执行 时 ， 堆 栈 如 下 
所 示 : 


显然 ,堆栈 证 明了 它 很 适合 于 保存 信息 ,包括 过 程 调 用 骨 套 。 一 般 说 来 堆栈 结构 用 于 
程序 需要 按照 特定 顺序 返回 的 情况 。 


5.2.4 ”向 过 程 传递 寄存 器 参数 


如 果 编 写 的 过 程 要 执行 一 些 标准 操作 ， 如 整数 数组 求 和 ， 那么， 在 过 程 中 包含 对 特定 变 
量 名 的 引用 就 不 是 一 个 好 主意 。 如 果 这 样 做 了 ， 该 过 程 就 只 能 作用 于 一 个 数组 。 更 好 的 方法 
是 向 过 程 传递 数组 的 偏 移 量 以 及 指定 数组 元 素 个 数 的 整数 。 这 些 内 容 被 称 为 参数 (或 输入 参 
数 )。 在 汇编 语言 中 ， 经 常用 通用 寄存 器 来 传递 参数 。 

在 前 面 的 章节 中 创建 了 一 个 简单 的 过 程 SumOf， 计 算 EAX、EBX 和 ECX 中 的 整数 之 
和 。 在 main 调用 SumOf 之 前 ， 将 数值 分 配给 EAX、EBX 和 ECX: 


.data 

theSum DWORD ? 
“code 

main PROC 


mov eax, 10000h ; 参数 

mov ebx,20000h ; 参数 

mov ecx,30000h ; 参数 

call Sumof 7 EAX= (EAX+EBX+ECX) 
mov theSum,eax ; 保存 和 数 


在 CALL 语句 之 后 ， 选 择 了 将 EAX 中 的 和 数 复制 给 一 个 变量 。 


5.2.5 示例 : 整数 数组 求 和 


程序 员 在 C++ 或 Java 中 编写 过 的 非常 常见 的 循环 类 型 是 计算 整数 数组 之 和 。 这 在 汇编 
语言 中 很 容易 实现 ， 它 可 以 被 编码 为 按照 尽 可 能 快 的 方式 来 运行 。 比 如 ， 在 循环 内 可 以 使 用 
寄存 器 而 非 变 量 。 

现在 创建 一 个 过 程 ArraySum ， 从 一 个 调用 程序 接收 两 个 参数 : 一 个 指向 32 位 整数 数组 
的 指针 ， 以 及 一 个 数组 元 素 个 数 的 计数 器 。 该 过 程 计算 和 数 ， 并 用 EAX 返回 数组 之 和 ; 


过 程 J17 





; 计算 32 位 整数 数组 元 素 之 和 。 
; 接收 : ESI= 数组 偏 移 量 

; ECX= 数组 元 素 的 个 数 
; 返回 : EAX= 数组 元 素 之 和 


ArraySum PROC 


ne ; 保存 ESI 和 ECX 


mov eax,0 


; 设置 和 数 为 0 
L1: add eax, [esi] 
add esi,TYPE DWORD ;将 每 个 整数 与 和 数 相 加 





;? 指向 下 一 个 整数 [150] 
loop Ll ; 按照 数组 大 小 重复 
pop ecx ; 恢复 ECX 和 了 SI 
pop esi 
ret ; 和 数 在 EAX 中 


ArraySum ENDP 


这 个 过 程 没有 特别 指定 数组 名 称 和 大 小 ， 它 可 以 用 于 任何 需要 计算 32 位 整数 数组 之 和 
的 程序 。 只 要 有 可 能 ， 编 程 者 也 应 该 编写 具有 灵活 性 和 适应 性 的 程序 。 
测试 ArraySum 过 程 


下 面 的 程序 通过 传递 一 个 32 位 整数 数组 的 偏 移 量 和 长 度 来 测试 ArraySum 过 程 。 调 用 
ArraySum 之 后 ， 程 序 将 过 程 的 返回 值 保存 在 变量 theSum 中 。 


; 测试 ArraySum 过 程 (TestArraySum.asm) 


.386 

.model flat, stdcall 

.Stack 4096 

ExitProcess PROTO, dwExitCode;DWORD 


.data 


array DWORD 10000h,20000h,30000h,40000h,50000h 
theSum DWORD ? 


.Code 

main PROC 
mov esi,OFFSET array ;ESI 指向 数组 
mov ecx,LENGTHOF array ;ECX= 数组 计数 器 
call ArraySum ; 计算 和 数 
mov theSum,eax ; 用 EAX 返回 和 数 
INVOKE ExitProcess,0 

main ENDP 


;ArraySum 
; 计算 32 位 整数 数组 之 和 , 
; 接收 : ESI= 数组 偏 移 量 
; ECX= 数组 元 素 的 个 数 
; 返回 : EAX= 数组 元 素 之 和 
ArraySum PROC 
push esi 
push ecx ;保存 ESI 和 ECX 
mov eax,0 
; 设置 和 数 为 0 

开工: 

add eax, [esi] 

add esi,TYPE DWORD ; 将 每 个 整数 与 和 数 相 加 

loop Ll ; 指向 下 一 个 整数 

; 按照 数组 大 小 重复 151 
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pop ecx 7 恢复 ECX 和 ESI 
pop esi 


ret ? 和 数 在 EAX 中 
ArraySum ENDP 


END main 


5.2.6 ”保存 和 恢复 寄存 器 


在 ArraySum 示例 中 ，ECX 和 ESI 在 过 程 开始 时 被 压 人 人 堆栈， 在 过 程 结束 时 被 弹出 堆 
栈 。 这 是 大 多 数 过 程 修改 寄存 器 的 典型 操作 。 总 是 保存 和 恢复 被 过 程 修改 的 寄存 器 ， 将 使 得 
调用 程序 确保 自己 的 寄存 器 值 不 会 被 覆盖 。 但 是 对 用 于 返回 数值 的 寄存 器 应 该 例外 ， 通 常 是 
指 EAX， 不 要 将 它们 压 人 和 弹出 堆栈 。 

USES 运算 符 

USES 运算 符 与 PROC 伪 指令 一 起 使 用 ， 让 程序 员 列 出 在 该 过 程 中 修改 的 所 有 寄存 器 
名 。USES 告诉 汇编 器 做 两 件 事 情 : 第 一 ， 在 过 程 开 始 时 生成 PUSH 指令 ， 将 寄存 器 保存 到 
堆栈 ; 第 二 ， 在 过 程 结 束 时 生成 POP 指令 ， 从 堆栈 恢复 寄存 器 的 值 。USES 运算 符 紧 跟 在 
PROC 之 后 ， 其 后 是 位 于 同一 行 上 的 寄存 器 列表 ， 表 项 之 间 用 空格 符 或 制 表 符 (不 是 逗号 ) 
分 隔 。 

5.2.5 节 给 出 的 ArraySum 过程 使 用 PUSH 和 POP 指令 来 保存 和 恢复 ESI 和 ECX。 
USES 运算 符 能 够 更 加 容易 地 实现 同样 的 功能 : 


ArraySum PROC USES esi ecx 


mov eax.0 ; 置 和 数 为 0 

bls 
add eax, [esi] ; 将 每 个 整数 与 和 数 相 加 
add esi,TYPE DWORD ; 指向 下 一 个 整数 
loop Ll ;按照 数组 大 小 重复 
ret ; 和 数 在 EAX 中 


ArraySum ENDP 


汇编 器 生成 的 相应 代码 展示 了 使 用 USES 的 效果 : 


ArraySum PROC 


push esi 
push ecx 
mov eax,0 ; 置 和 数 为 0 
Ll: 
add eax,[esi] ; 和 将 每 个 整数 与 和 数 相 加 
add esi,TYPE DWORD ; 指向 下 一 个 整数 
loop Ll ; 按照 数组 大 小 重复 
pop ecx 
pop esi 


ArraySum ENDP 


调试 提示 : 使 用 Microsoft Visual Studio 调试 器 可 以 查看 由 MASM 高 级 运算 符 和 伪 


指令 生成 的 隐藏 机 器 指令 。 在 调试 窗口 中 右键 点 击 ， 选 择 Go To Disassembly。 该 窗口 显 
示 程 序 源 代码 ， 以 及 由 汇编 器 生成 的 隐藏 机 器 指令 。 





例外 “ 当 过 程 利 用 寄存 器 (通常 用 EAX) 返回 数值 时 ， 保 存 使 用 寄存 器 的 惯例 就 出 现 了 
一 个 重要 的 例外 。 在 这 种 情况 下 ,返回 寄存 器 不 能 被 压 人 和 弹出 堆栈 。 例 如 下 述 SumOf 过 
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程 把 EAX 压 入 、 弹 出 堆栈 ， 就 会 丢失 过 程 的 返回 值 : 


SumOf PROC ; 三 个 整数 之 和 
push eax ; 保存 EAX 
add eax, ebx 
add eax,ecx ; 计算 EAX、EBX 和 ECX 之 和 
POP eax ; 和 数 丢失 ! 
ret 

SumOf ENDP 
5.2.7 本 节 回 顾 


1.( 真 / 假 ): PROC 伪 指 令 标识 过 程 的 开始 ，ENDP 伪 指 令 标识 过 程 的 结束 。 
2.( 真 / 假 ): 可 以 在 现 有 过 程 中 定义 一 个 过 程 。 

3. 如 果 在 过 程 中 省 略 RET 指令 会 发 生 什么 情况 ? 

4. 在 建议 的 过 程 说 明 中 ， 如 何 使 用 名 称 Receives 和 Returns ? 

5.( 真 / 假 ) CALL 指令 把 自身 指令 的 偏 移 量 压 人 堆栈 。 

6.( 真 / 假 ): CALL 指令 把 紧 跟 其 后 的 指令 的 偏 移 量 压 人 堆栈 。 


5.3 ”链接 到 外 部 库 


如 果 编 程 者 花 时 间 的 话 ， 就 可 以 用 汇编 语言 编写 出 详细 的 输入 输出 代码 。 就 好 比 自己 从 
头 开始 搭建 汽车 ， 然 后 可 以 驾车 出 行 一 样 。 这 个 工作 很 有 趣 但 也 很 耗 时 。 在 第 11 章 ， 读 者 
将 有 机 会 了 解 MS-Windows 模式 下 如 何 处 理 输入 输出 。 这 是 很 大 的 乐趣 ， 当 看 到 那些 有 用 
的 工具 时 ， 一 个 新 的 世界 就 展现 在 眼前 。 不 过 现在 ， 在 学 习 汇编 语言 基础 时 ， 输 入 输出 应 该 
是 很 容易 的 。5.3 节 将 说 明 如 何 从 本 书 的 链接 库 Irvine32.lib 和 Irvine64.obj 中 调用 过 程 。 完 
整 的 链接 库 源 代码 可 以 在 本 书 作者 网 站 ( asmirvine.com) 上 获取 。 在 计算 机 上 安装 时 ， 应 该 
将 它 安装 在 本 书 安装 文件 (通常 命名 为 C: \Irvine) 下 的 Examples\Libs32 子 文件 夹 中 。 

Irvine32 链接 库 只 能 用 于 32 位 模式 下 运行 的 程序 。 它 包含 了 链接 到 MS-Windows API 
的 过 程 ， 生 成 输入 输出 。 对 64 位 应 用 程序 来 说 ，Irvine64 链接 库 的 限制 更 多 ， 它 仅 限 于 基 
本 显示 和 字符 串 操 作 。 


5.3.1 背景 知识 


链接 库 是 一 种 文件 ， 包 含 了 已 经 汇编 为 机 器 代码 的 过 程 ( 子 程序 )。 链 接 库 开始 时 是 一 
个 或 多 个 源 文件 ， 这 些 文 件 再 被 汇编 为 目标 文件 。 目 标 文件 插入 到 一 个 特殊 格式 文件 ， 该 
文件 由 链接 器 工具 识别 。 假 设 一 个 程序 调用 过 程 WriteString 在 控制 台 窗 口 显示 一 个 字符 串 。 
该 程序 源 代码 必须 包含 PROTO 伪 指 令 来 标识 WriteString 过 程 : 


WriteString proto 

之 后 ，CALL 指令 执行 WriteString: 

call Writestring 

当 程 序 进行 汇编 时 ， 汇 编 器 将 不 指定 CALL 指令 的 目标 地 址 ， 它 知道 这 个 地 址 将 由 链接 


器 指定 。 链 接 器 在 链接 库 中 寻找 WriteString， 并 把 库 中 适当 的 机 器 指令 复制 到 程序 的 可 执行 
文件 中 。 同 时 ， 它 把 WriteString 的 地 址 插入 到 CALL 指令 。 如 果 被 调用 过 程 不 在 链接 库 中 ， 
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链接 器 就 发 出 错误 信息 ， 且 不 会 生成 可 执行 文件 。 
链接 命令 选项 ”链接 器 工具 把 一 个 程序 的 目标 文件 与 一 个 或 多 个 目标 文件 以 及 链接 库 组 
合 在 一 起 。 比 如 ， 下 述 命令 就 将 hello.obj 与 irvine32.lib 和 kernel32.lib 库 链接 起 来 : 


link hello.obj irvine32.1ib kernel32.1ib 


32 位 程序 链接 kernel32.lib 文件 是 Microsoft Windows 平台 软件 开发 工具 (Software 
Development Kit) 的 一 部 分 ， 它 包含 了 kernel32.dll 文件 中 系统 函数 的 链接 信息 。kernel32. 
dl 文件 是 MS-Windows 的 一 个 基本 组 成 部 分 ， 被 称 为 动态 链接 库 ( dynamic link library ) 。 
它 含 有 的 可 执行 函数 实现 基于 字符 的 输入 和 输出。 图 5-9 展 链接 到 
示 了 为 什么 kernel32.lib 是 通 向 kernel32.dll 的 桥梁 。 

在 第 1 章 到 第 10 章 中 ， 程 序 都 链接 到 Irvine32.lib 或 可 以 链接 到 










者 Irvine64.obj。 第 11 章 说 明了 如 何 将 程序 直接 链接 到 
kernel32.lib。 玫 


5.3.2 本 节 回 顾 


图 5-9 32 位 程序 链接 
1.( 真 / 假 ); 链接 库 由 汇编 语言 源 代 码 组 成 


2. 在 一 个 外 部 链接 库 中 ， 用 PROTO 伪 指 令 声明 过 程 MyProc。 
3. 编写 CALL 语句 调用 外 部 链接 库 中 的 过 程 MyProc。 

4. 本 书 支持 的 32 位 链接 库 的 名 称 是 什么 ? 

5. kernel32.dll 是 什么 类 型 的 文件 ? 


5.4 |Irvine32 链接 库 


5.4.1 创建 库 的 动机 


汇编 语言 编程 没有 Microsoft 认可 的 标准 库 。 在 20 世纪 80 年 代 早 期 ， 程 序 员 第 一 次 开始 
为 x86 处 理 器 编写 汇编 语言 时 ，MS-DOS 是 常用 的 操作 系统 。 这 些 16 位 程序 可 以 调用 MS- 
DOS 函数 ( 即 INT 21h 服务 ) 来 实现 简单 的 输入 输出 。 即 使 是 在 那个 时 代 ， 如 果 想 在 控制 台 
上 显示 一 个 整数 ， 也 需要 编写 一 个 相当 复杂 的 程序 ， 将 整数 的 内 部 二 进 制 表示 转换 为 可 以 在 
屏幕 上 显示 的 ASCII 字符 序列 。 这 个 过 程 被 称 为 WriteInt， 下 面 是 其 抽象 为 伪 代 码 的 逻辑 : 
初始 化 : 


let n equal the binary value 
let buffer be an array of char[size] 


算法 : 
i = size -1 ; 缓冲 区 最 后 一 个 位 置 
repeat 

r = nmod 10 ; 余数 

二 二 下 7 了 0 7 整数 除法 

digit = r OR 30h ; 将 工 转 换 为 ASCIT 数字 


buffer[i--] = digit ; 保存 到 缓冲 区 
until n=0 
if n is negative 

Bufferfti) = "= ; 插入 负 号 
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while i > 0 
print bufferfil] 

注意 ， 数 字 是 按照 逆序 生成 ,插入 缓冲 区 ， 从 后 往 前 移动 。 然 后 ， 数 字 按 照 正 序 写 到 控 
制 台 。 昌 然 这 段 代码 简单 到 足以 用 C/C++ 实现, 但 是 如 果 是 在 汇编 语言 中 ， 它 还 需要 一 些 
高 级 技巧 。 

专业 程序 员 通 常 更 愿意 自己 建立 库 ， 这 是 一 种 很 好 的 学 习 经 验 。 在 Windows 的 32 位 模 
式 下 ， 输 入 输出 库 必须 能 直接 调用 操作 系统 的 内 容 。 这 个 学 习 曲线 相当 陡峭 ， 对 编程 初学 者 
提出 了 一 些 挑战 。 因 此 ，Irvine32 链接 库 被 设计 成 给 初学 者 提供 简单 的 输入 输出 接口 。 随 着 
对 本 书 学 习 的 推进 ， 读 者 将 能 获得 自己 创建 库 的 知识 和 技术 。 只 要 成 为 库 的 创建 者 ， 就 能 自 


由 地 修改 和 重用 库 。 第 13 章 将 讨论 另 一 种 方法 ， 即 从 汇编 语言 程序 中 调用 标准 C 库 函 数 。 
同样 ， 这 种 方法 也 需要 一 些 其 他 的 背景 知识 。 
表 5-1 列 出 了 Irvine32 链接 库 的 全 部 过 程 。 


表 5-1 Ilrvine32 链接 库 的 过 程 

过 程 说 明 
CloseFile 关闭 之 前 已 经 打开 的 磁盘 文件 
Clrscr 清除 控制 台 窗口 ， 并 将 光标 置 于 左上 角 
CreateOutputFile 为 输出 模式 下 的 写 操作 创建 一 个 新 的 磁盘 文件 
Crlf 在 控制 台 窗 口中 写 一 个 行 结束 的 序列 
Delay 程序 执行 暂停 指定 的 n 毫秒 
DumpMem 以 十 六 进 制 形式 ， 在 控制 台 窗 口 写 一 个 内 存 块 

以 十 六 进 制 形式 显示 EAX 、EBX、ECX、EDX、ESI、EDI、EBP、ESP、EFLAGS 和 EIP 

DumpRegs 


GetCommandTail 


寄存 器 。 也 显示 最 常见 的 CPU 状态 标志 位 


复制 程序 命名 行 参数 ( 称 为 命令 尾 ) 到 一 个 字 节 数组 


GetDateTime 从 系统 获取 当前 日 期 和 时 间 

GetMaxXY 返回 控制 台 窗口 缓冲 器 的 行 数 和 列 数 

GetMseconds 返回 从 午夜 开始 经 过 的 毫秒 数 

GetTextColor 返回 当前 控制 台 窗口 的 前 景色 和 背景 色 

Gotoxy 将 光标 定位 到 控制 台 窗口 内 指定 的 位 置 

IsDigit 如 果 AL 寄存 器 中 包含 了 十 进 制 数字 ( 0 一 9 ) 的 ASCII 码 ， 则 零 标志 位 置 1 
MsgBox 显示 一 个 弹出 消息 框 

MsgBoxAsk 在 弹出 消息 框 中 显示 yes/no 问题 

OpenInputFile 打开 一 个 已 有 磁盘 文件 进行 输入 操作 


ParseDecimal32 


ParseInteger32 


将 一 个 无 符号 十 进 制 整数 字符 串 转换 为 32 位 二 进 制 数 
将 一 个 有 符号 十 进 制 整数 字符 串 转换 为 32 位 二 进 制 数 


Random32 在 0~FFFFFFFFh 范围 内 ， 生 成 一 个 32 位 的 伪 随 机 整数 
Randomize 用 一 个 值 作为 随机 数 生成 器 的 种 子 

RandomRange 在 特定 范围 内 生成 一 个 伪 随 机 整数 

ReadChar 等 待 从 键盘 输入 一 个 字符 ， 并 返回 该 字符 

ReadDec 从 键盘 读 取 一 个 无 符号 32 位 十 进 制 整数 ， 用 回 车 符 结 束 
ReadFromFile 将 一 个 输入 磁盘 文件 读 和 人 缓冲 区 

ReadHex 从 键盘 读 取 一 个 32 位 十 六 进 制 整数 ， 用 回 车 符 结束 


ReadInt 


从 键盘 读 取 一 个 有 符号 32 位 十 进 制 整数 ， 用 回 车 符 结束 
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( 续 ) 


过 程 说 明 

ReadKey 无 需 等 待 输入 即 从 键盘 输入 缓冲 区 读 取 一 个 字符 

ReadString 从 键盘 读 取 一 个 字符 串 ， 用 回 车 符 结 束 

SetTextColor 设置 控制 台 输 出 字符 的 前 景色 和 背景 色 

Str compare 比较 两 个 字符 串 

Str_copy 将 源 字符 串 复制 到 目的 字符 串 

Str_length 用 EAX 返回 字符 串 长 度 

Str_trim 从 字符 串 删 除 不 需要 的 字符 

Str_ucase 将 字符 串 转换 为 大 写字 母 

WaitMsg 显示 信息 并 等 待 按键 操作 

WriteBin 用 ASCI 二 进 制 格式 ， 向 控制 台 窗 口 写 一 个 无 符号 32 位 整数 

WriteBinB 用 字 节 、 字 或 双 字 格 式 向 控制 台 窗口 写 一 个 二 进 制 整数 

WriteChar 在 控制 台 窗 口 写 一 个 字符 

WriteDec 用 十 进 制 格式 ， 向 控制 台 窗 口 写 一 个 无 符号 32 位 整数 

WriteHex 用 十 六 进 制 格式 ， 向 控制 台 窗口 写 一 个 32 位 整数 

WriteHexB 用 十 六 进 制 格式 ， 向 控制 台 窗 口 写 一 个 字 节 、 字 或 双 字 整数 

Writelnt 用 十 进 制 格式 ， 向 控制 台 窗 口 写 一 个 有 符号 32 位 整数 

WriteStackFrame 向 控制 台 窗口 写 当前 过 程 的 堆栈 帧 

WriteStackFrameName | ”向 控制 台 窗 口 写 当 前 过 程 的 名 称 和 堆栈 帧 

WriteString 向 控制 台 窗口 写 一 个 以 空 字 符 结束 的 字符 串 

WriteToFile 将 缓冲 区 内 容 写 人 一 个 输出 文件 

WriteWindowsMsg 显示 一 个 字符 串 ， 包 含 MS-Windows 最 近 一 次 产生 的 错误 
5.4.2 概述 


控制 台 窗 口 ”控制 台 窗 口 (console window) (或 命令 窗口 command window) 是 显示 命 
令 提 示 符 时 ， 由 MS-Windows 生成 的 一 个 纯 文 本 窗口 。 

要 想 Microsoft Windows 中 显示 一 个 控制 台 窗 口 ， 在 桌面 上 单 击 Start 按钮 ， 并 在 Start 
Search 框 中 输入 cmd， 然 后 单 击 回 车 。 打 开 控制 台 窗口 后 ， 右 键 点 击 窗口 左上 角 的 系统 菜 
单 ， 就 可 以 重新 定义 控制 台 窗 口 缓冲 区 的 大 小 ， 从 弹出 菜单 中 选择 Properties， 然 后 修改 数 
值 ， 如 图 5-10 所 示 。 

还 可 以 选择 不 同 的 字体 大 小 和 颜色 。 默 认 的 控制 台 窗 口 为 25 行 x 80 列 ， 使 用 mode 命 
令 可 以 修改 它 的 行 数 和 列 数 。 例 如 ， 在 命令 提示 符 下 键 人 下 述 内 容 ， 则 将 控制 台 窗 口 设 置 为 
30 行 x40 列 : 


mode con cols=40 lines=30 


文件 句柄 ( file handle) 是 一 个 32 位 整数 ，Windows 操作 系统 用 它 来 标识 当前 打开 的 文 
件 。 当 用 户 程序 调用 一 个 Windows 服务 来 打开 或 创建 文件 时 ， 操 作 系统 就 创建 一 个 新 的 文 
件 句柄 ， 并 使 其 对 用 户 程序 可 用 。 每 当 程序 调用 OS 服务 方法 来 读 写 该 文件 时 ， 就 必须 将 这 
个 文件 句柄 作为 参数 传递 给 服务 方法 。 

注意 : 如 果 用 户 程序 调用 Irvine32 链接 库 中 的 过 程 ， 就 必须 总 是 将 这 个 32 位 数值 压 人 
运行 时 堆栈 ;如 果 不 这 样 做 ， 被 库 调用 的 Win32 控制 台 函 数 就 不 能 正常 工作 。 
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图 5-10 ”修改 控制 台 窗 口 属性 


5.4.3 过程 详细 说 明 


本 节 将 逐一 介绍 Irvine32 链接 库 中 的 过 程 是 如 何 使 用 的 ， 同 时 也 会 忽略 一 些 更 高 级 的 过 
程 ， 它 们 将 在 后 续 章 节 中 进行 解释 。 

CloseFile CloseFile 过 程 关 闭 之 前 已 经 创建 或 打开 的 文件 (参见 CreateOutputFile 和 
OpenInputFile)。 该 文件 用 一 个 32 位 整数 的 句柄 来 标识 ， 句 柄 由 EAX 传递 。 如 果 文 件 成 功 
关闭 ，EAX 中 的 返回 值 就 是 非 零 的 。 示 例如 下 : 


mov eax,fileHandle 
call CloseFile 


Clrscr ”Clrscr 过 程 清除 控制 台 窗口 。 该 过 程 通常 在 程序 开始 和 结束 时 被 调用 。 如 果 在 
其 他 时 间 调 用 这 个 过 程 ， 就 需要 先 调用 WaitMsg 来 暂停 程序 ， 这 样 就 可 以 让 用 户 在 屏幕 被 
清除 之 前 ， 阅 读 屏 幕 上 的 信息 。 调 用 示例 如 下 : 

call WaitMsg ; “Press any key...” 

call Clrscr 

CreateOutputFile “CreateOutputFile 过 程 创 建 并 打开 一 个 新 的 磁盘 文件 ， 进 行 写 操作 。 
调用 该 过 程 时 ， 将 文件 名 的 偏 移 量 送 入 EDX。 过 程 返回 后 ， 如 果 文 件 创建 成 功 则 EAX 将 包 
含 一 个 有 效 文件 句柄 (32 位 整数 )， 否 则 ，EAX 将 等 于 INVALID_HANDLE_VALUE (一 个 
预定 义 的 常数 )。 调 用 示例 如 下 : 


.data 

filename BYTE “newfile.txt" ,0 
.Code 

mov edx,OFFSET filename 

call CreateOutputFile 
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下 面 的 伪 代 码 描述 的 是 调用 CreateOutputFile 之 后 ， 可 能 会 出 现 的 结果 : 


IE EAX = INVALID HANDLE_VALUE 


the file was not created successfully 
else 


EAX = handle for the open file 
endif 


Crlf Crlf 过 程 将 光标 定位 在 控制 台 窗 口 下 一 行 的 开始 位 置 。 它 写 的 字符 串 包 含 了 
ASCII 字符 代码 0Dh 和 0Ah。 调 用 示例 如 下 : 


call Crlf 


Delay Delay 过 程 按 照 特定 上 毫秒 数 暂 停 程 序 。 在 调用 Delay 之 前 ， 将 预定 时 间 间 隔 送 
人 EAX。 调 用 示例 如 下 : 


mov eax,1000 ;1 秒 
call Delay 


DumpMen DumpMen 过 程 在 控制 台 窗 口中 用 十 六 进 制 的 形式 显示 一 段 内 存 区 域 。ESI 
中 存放 的 是 内 存 区域 首 地 址 ; ECX 中 存放 的 是 单元 个 数 ; EBX 中 存放 的 是 单元 大 小 ( 1= 字 
节 ，2= 字 ，4= 双 字 )。 下 述 调 用 示例 用 十 六 进 制 形式 显示 了 包含 11 个 双 字 的 数组 : 


.data 


array DWORD 1,2,3,4,5,6,7,8,9,0Ah,O0OBh 
.Code 
main PROC 


mov esi,OFFSET array ; 首 地 址 偏 移 量 
mov ecx,LENGTHOF array ，; 单元 个 数 
mov ebx,TYPE array ; 双 字 格式 
call DumpMem 


产生 的 输出 如 下 所 示 : 

00000001 00000002 00000003 00000004 00000005 00000006 

00000007 00000008 00000009 0000000A 0000000B 

DumpRegs DumpRegs 过 程 用 十 六 进 制 形式 显示 EAX、EBX、ECX、EDX、ESI、 
EDI、EBP、ESP、EIP 和 EFL (EFLAGS) 的 内 容 ， 以 及 进位 标志 位 、 符 号 标志 位 、 零 标志 位 
溢出 标志 位 、 辅 助 进位 标志 位 和 奇偶 标志 位 的 值 。 调 用 示例 如 下 : 


call DumpRegs 


示例 输出 如 下 所 示 : 


EAX=00000613 EBX=00000000 ECX=000000FF EDX=00000000 
ESI=00000000 EDI=00000100 EBP=0000091E ESP=000000F6 
EIP=00401026 EFL=00000286 CF=0 SF=1 2ZF=0 OF=0 AF=0 PF=1 


EIP 显示 的 数值 是 调用 DumpRegs 的 下 一 条 指令 的 偏 移 量 。DumpRegs 在 调试 程序 时 很 
有 用 ， 因 为 它 显 示 了 CPU 快照 。 该 过 程 没有 输入 参数 和 返回 值 。 

GetCommandTail GetCommandTail 过 程 将 程序 命令 行 复 制 到 一 个 空 字 节 结 束 的 字符 
串 。 如 果 命 令 行 是 空 ， 则 进位 标志 位 置 1 ; 否则 进位 标志 位 清 零 。 该 过 程 的 作用 在 于 能 让 程 
序 用 户 通 过 命令 行 传递 参数 。 假 设 有 一 程序 Encrypt.exe 读 取 输入 文件 filel.txt， 并 产生 输出 
文件 file2.txt。 程 序 运行 时 ， 用 户 可 以 通过 命令 行 传递 这 两 个 文件 名 : 


Encrypt filel.txt file2.txt 
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当 Encrypt 程 序 启 动 时 ， 它 可 以 调用 GetCommandTail， 检 索 这 两 个 文件 名 。 调 用 
GetCommandTail 时 ，EDX 必须 包含 一 个 数组 的 偏 移 量 ， 该 数组 至 少 要 有 .129 个 字 节 。 调 用 
示例 如 下 : 


.data 

cmdTail BYTE 129 DUP(0)  ; 空 缓冲 区 
-Code 

mov edx,OFFSET cmdTail 

call GetCommandTail ; 填充 缓冲 区 


在 Visual Studio 中 运行 应 用 程序 时 ， 有 一 种 方法 可 以 传递 命令 行 参数 。 在 Project 菜单 
中 ， 选 择 <projectname>Properties。 在 Property Pages 窗口 ， 展 开 Configuration Properties 选 
项 ， 选 择 Debugging。 然 后 ， 在 右边 Command Arguments 面板 的 编辑 行 中 输入 程序 的 命令 
参数 。 

GetMaxXY GetMaxXY 过 程 获取 控制 台 窗 口 缓冲 区 的 大 小 。 如 果 控 制 台 窗 口 缓冲 区 
大 于 可 视窗 口 尺 寸 ， 则 自动 显示 滚动 条 。GetMaxXY 没有 输入 参数 。 当 过 程 返回 时 ，DX 寄 
存 器 包含 了 缓冲 区 的 列 数 ，AX 寄存 器 包含 了 缓冲 区 的 行 数 。 每 个 数值 的 可 能 范围 都 不 超过 
255， 这 也 许 会 小 于 实际 窗口 缓冲 区 的 大 小 。 调 用 示例 如 下 : 

gee BYTE ? 

cols BYTE ? 

.Code 

call GetMaxXY 


mov rows,al 
mov cols,dl 


GetMseconds GetMseconds 过 程 获 取 主 机 从 午夜 开始 经 过 的 毫秒 数 ， 并 用 EAX 返回 
该 值 。 在 计算 事件 间隔 时 间 时 ， 这 个 过 程 是 非常 有 用 的 。 过 程 不 需要 输入 参数 。 下 面 的 例子 
调用 了 GetMseconds， 并 保存 了 返回 值 。 执 行 循 环 之 后 ， 代 码 第 二 次 调用 GetMseconds， 并 
将 两 次 返回 的 时 间 值 相 减 ， 结 果 就 是 执行 循环 的 大 致 时 间 : 

.data 

MO DWORD ? 

.code 

call GetMseconds 

mov startTime,eax 

Ll: 

; (loop body) 
loop L1 
call GetMseconds 
sub eax,startTime ;EAX= 循环 时 间 ， 按 毫秒 计 


GetTextColor GetTextColor 过 程 获取 控制 台 窗 口 当前 的 前 景色 和 背景 色 ， 它 没有 输入 
参数 。 返 回 时 ，AL 中 的 高 四 位 是 背景 色 ， 低 四 位 是 前 景色 。 调 用 示例 如 下 : 


data 

Color byte ? 

.code 

call GetTextColor 
mov color,AL 


Gotoxy ”Gotoxy 过 程 将 光标 定位 到 控制 台 窗 口 的 指定 位 置 。 默 认 情 况 下 ， 控 制 台 窗 口 
的 X 轴 范围 为 0 一 79, Y 轴 范围 为 0 ~ 24。 调 用 Gotoxy 时 , 将 Y 轴 ( 行 数 ) 传递 到 DH 寄 
存 器 ，X 轴 ( 列 数 ) 传递 到 DL 寄存 器 。 调 用 示例 如 下 


126 血 5 喝 


mov dh,10 ;第 10 行 





mov dl,20 ;第 20 列 
call Gotoxy ; 定位 光标 
161] 用 户 可 能 会 修改 控制 台 窗 口 大 小 ， 因 此 可 以 调用 GetMaxXY 获取 当前 窗口 的 行列 数 。 


lsDigit IsDigit 过 程 确 定 AL 中 的 数值 是 否 是 一 个 有 效 十 进 制 数 的 ASCII 码 。 过 程 被 调 
用 时 ,将 一 个 ASCII 字符 传递 到 AL。 如 果 AL 包含 的 是 一 个 有 效 十 进 制 数 ， 则 过 程 将 零 标 
志 位 置 1; 否则 ， 清 除 零 标志 位 。 调 用 示例 如 下 : 


mov AL, somechar 
call IsDigit 


MsgBox MsgBox 过 程 显示 一 个 带 选 择 项 的 图 形 界面 弹出 消息 框 。( 当 程序 运行 于 控制 
台 窗 口 时 有 效 。) 过 程 用 EDX 传递 一 个 字符 串 的 偏 移 量 ， 该 字符 串 将 显示 在 消息 框 中 。 还 可 
以 用 EBX 传递 消息 框 标题 字符 串 的 偏 移 量 ， 如 果 标 题 为 空 ， 则 EBX 为 0。 调 用 示例 如 下 : 


.data 

caption BYTE "Dialog Title", 0 

HelloMsg BYTE “This is a pop-up message box.", 0dh,0ah 
BYTE "CLick OK tO continue。..", 0 

Code 

mov ebx,OFFSET caption 

mov edx,OFFSET HelloMsg 

call MsgBox 


示例 输出 如 下 : 


Diaiog Titie 


Thes 5 4 Po-UD Message bax 
Chey oF to conbroe 


MsgBoxAsk MsgBoxAsk 过 程 显示 带 有 Yes 和 No 按钮 的 图 形 弹 出 消息 框 。( 当 程序 运 
行 于 控制 台 窗 口 时 有 效 。) 过 程 用 EDX 传递 问题 字符 串 的 偏 移 量 ， 该 问题 字符 串 将 显示 在 
消息 框 中 。 还 可 以 用 EBX 传递 消息 框 标题 字符 串 的 偏 移 量 ， 如 果 标 题 为 空 ， 则 EBX 为 0。 
MsgBoxAsk 用 EAX 中 的 返回 值 表示 用 户 选 择 的 是 哪个 按钮 ， 返 回 值 有 两 个 选择 ， 都 是 预先 
定义 的 Windows 常数 : IDYES ( 值 为 6 ) 或 IDNO ( 值 为 7)。 调 用 示例 如 下 : 


.data 

caption BYTE "Survey Completed",0 

question BYTE “Thank you for completing the survey." 
BYTE 0dh,0ah 
BYTE "Would you like to receive the results?",0 

.Code 

mov ebx,OFFSET caption 

mov edx,OFFSET question 

call MsgBoxAsk 

162] ; 查看 EAX 中 的 返回 什 


示例 输出 如 下 : 








2 Thank -ou fer completing the survey. 


‘Would vou like to receme the results? 


Ch 





过 程 727 


OpenlnputFile OpenInputFile 过 程 打开 一 个 已 存在 的 文件 进行 输入 。 过 程 用 EDX 传 
递 文件 名 的 偏 移 量 。 当 从 过 程 返回 时 ， 如 果 文 件 成 功 打 开 ， 则 EAX 就 包含 有 效 的 文件 句柄 。 
否则 ，EAX 等 于 INVALID_ HANDLE VALUE (一 个 预定 义 的 常数 )。 

调用 示例 如 下 : 


-data 

filename BYTE “myfile.txt” ,0 
.Code 

mov edx,OFFSET filename 
call OpenInputFile 


下 述 伪 代码 显示 了 调用 OpenInputFile 后 可 能 的 结果 


if EAX = INVALID HANDLE_VALUE 

the file was not opened successfully 
else 

EAX = handle for the open file 
endif 


ParseDecimal32 ”ParseDecimal32 过 程 将 一 个 无 符号 十 进 制 整 数字 符 串 转换 为 32 位 二 
进 制 数 。 非 数字 符号 之 前 所 有 的 有 效 数 字 都 要 转 ， 前 导 空 格 要 忽略 。 过 程 用 EDX 传递 字符 
串 的 偏 移 量 ， 用 ECX 传递 字符 串 的 长 度 ， 用 EAX 返回 二 进 制 数值 。 调 用 示例 如 下 : 


.data 

buffer BYTE "8193" 

bufSize = ($ - buffer) 

.Code 

mov edx,OFFSET buffer 

mov ecx,bufSize 

call ParseDecimal32 ; 返回 EAX 


e 如 果 整 数 为 空 ， 则 EAX=0 且 CF=1 

e 如 果 整 数 只 有 空格 ， 则 EAX=0 且 CF=1 

e 如 果 整 数 大 于 ( 22-1)， 则 EAX=0 且 CF=1 

e 否则 ，EAX 为 转换 后 的 数 ， 且 CF=0 

参阅 ReadDec 过 程 的 说 明 ， 详 细 了 解 进位 标志 位 是 如 何 受 到 影响 的 。 

Parselnteger32 ParseInteger32 过 程 将 一 个 有 符号 十 进 制 整数 字符 串 转 换 为 32 位 二 进 
制 数 。 字 符 串 开始 到 第 一 个 非 数 字符 号 之 间 所 有 的 有 效 数字 都 要 转 ， 前 导 空格 要 忽略 。 过 程 
用 EDX 传递 字符 串 的 偏 移 量 ， 用 ECX 传递 字符 串 的 长 度 ， 用 EAX 返回 二 进 制 数值 。 调 用 
示例 如 下 : 


"data 

buffer byte "~-8193" 

bufSize = ($ - buffer) 

.Code 

mov edx,OFFSET buffer 

mov ecx,bufSize 

call ParseInteger32 ; 运 回 EAX 


字符 串 可 能 包含 一 个 前 导 加 号 或 减 号 ， 但 其 后 只 能 跟 十 进 制 数字 。 如 果 数 值 不 能 表示 为 
32 位 有 符号 整数 (范围 : -2 147 483 648 到 +2 147 483 647 )， 则 溢出 标志 位 置 1， 且 在 控制 
台 显 示 一 个 错误 信息 。 

Random32 Random32 过 程 生成 一 个 32 位 随机 整数 并 用 EAX 返回 该 数 。 当 被 反复 调 
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用 时 ，Random32 就 会 生成 一 个 模拟 的 随机 数 序列 ， 这 些 数 由 一 个 简单 的 函数 产生 ， 该 函数 
有 一 个 输入 称 为 种 子 〈seed)。 函 数 利 用 公式 里 的 种 子 生 成 一 个 随机 数值 ， 并 且 每 次 都 使 用 
前 次 生成 的 随机 数 作为 种 子 ， 来 生成 后 续 随 机 数 。 下 述 代码 段 展 示 了 一 个 调用 Random32 的 
例子 : 


.data 

randVval DWORD ? 
.code 

call Random32 
mov randVal,eax 


Randomize ”Randomize 过 程 对 Random32 和 RandomRange 过 程 的 第 一 个 种 子 进行 初 
始 化 。 种 子 等 于 一 天 中 的 时 间 ， 精 度 为 /100 秒 。 每 当 调 用 Random32 和 RandomRange 的 
程序 运行 时 ， 生 成 的 随机 数 序列 都 不 相同 。 而 Randomize 过 程 只 需要 在 程序 开头 调用 一 次 。 
下 面 的 例子 生成 了 10 个 随机 整数 : 


call Randomize 
mov ecx,10 
Ll: call Random32 


; 在 此 使 用 或 显示 EAX 中 的 随机 数 
loop Ll 


RandomRange RandomRange 过 程 在 范围 0 一 n-1 内 生成 一 个 随机 整数 ， 其 中 是 用 
EAX 寄存 器 传递 的 输入 参数 。 生 成 的 随机 数 也 用 EAX 返回 。 下 面 的 例子 在 0 到 4999 之 间 
生成 一 个 随机 整数 ， 并 将 其 放 在 变量 randVal 中 。 


data 

randVal DWORD ? 
Code 

mov eax,5000 
call RandomRange 
mov randVal,eax 


ReadChar ReadChar 过 程 从 键盘 读 取 一 个 字符 ， 并 用 AL 寄存 器 返回 ， 字 符 不 在 控制 
台 窗 口中 回 显 。 调 用 示例 如 下 : 


.data 

char BYTE ? 
,code 

call ReadChar 
mov Cchar,al 


如 果 用 户 按 下 的 是 扩展 键 ， 如 功能 键 、 方 向 键 、Ins 键 或 Del 键 ， 则 过 程 就 把 AL 清 零 ， 
而 AH 包含 的 是 键盘 扫描 码 。 本 书 文 前 给 出 了 扫描 码 列表 。EAX 的 高 字 节 没有 使 用 。 下 述 
伪 代 码 描 述 了 调用 ReadChar 之 后 可 能 产生 的 结果 : 


if an extended key was pressed 


AbL= 0 

AH = keyboard scan code 
else 

AL = ASCIT key value 
endif 


ReadDec ReadDec 过 程 从 键盘 读 取 一 个 32 位 无 符号 十 进 制 整数 ， 并 用 EAX 返回 该 
值 ， 前 导 空格 要 忽略 。 返 回 值 为 遇 到 第 一 个 非 数字 字符 之 前 的 所 有 有 效 数 字 。 比 如 ， 如 果 用 
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户 输入 123ABC， 则 EAX 中 的 返回 值 为 123。 下 面 是 一 个 调用 示例 : 


.data 

intVal DWORD ? 

.Code 

call ReadDec 

mov intVal,eax 

ReadDec 会 影响 进位 标志 位 : 

e 如 果 整 数 为 空 ， 则 EAX=0 且 CF=1 

e 如 果 整 数 只 有 空格 ， 则 EAX=0 且 CF=1 

e@ 如 果 整 数 大 于 (22-1 )， 则 EAX=0 且 CF=1 

e 否则 ，EAX 为 转换 后 的 数 ， 且 CF=0 

ReadFromFile ReadFromFile 过 程 读 取 存储 缓冲 区 中 的 一 个 输入 磁盘 文件 。 当 调用 
ReadFromFile 时 ， 用 EAX 传递 打开 文件 的 句柄 ， 用 EDX 传递 缓冲 区 的 偏 移 量 ， 用 ECX 
传递 读 取 的 最 大 字 节 数 。ReadFromFile 返回 时 要 查看 进位 标志 位 的 值 : 如 果 CF 清 零 ， 则 
EAX 包含 了 从 文件 中 读 取 的 字 节 数 ; 如 果 CF 置 1， 则 EAX 包含 了 数字 系统 错误 代码 。 调 
用 WriteWindowsMsg 过 程 就 可 以 获得 该 错误 的 文本 。 在 下 面 的 例子 中 ， 从 文件 读 取 的 5000 
个 字 节 复制 到 了 缓冲 区 变量 : 


.data 

BUFFER SIZE = 5000 

buffer BYTE BUFFER SIZE DUP(?) 
bytesRead DWORD ? 


.Code 

mov edx,OFFSET buffer  ; 指向 缓冲 区 

mov ecx,BUFFER SIZE ; 读 取 的 最 大 字 节 数 

call ReadFromFile ; 读 文 件 } 

如 果 此 时 进位 标志 位 清 零 ， 则 可 以 执行 如 下 指令 : 
mov bytesRead,eax  ，; 实际 读 取 的 字 节 数 


但 是 ， 如 果 此 时 进位 标志 位 置 1， 就 可 以 调用 WriteWindowsMsg 过 程 ， 显 示 错 误 代 码 
以 及 该 应 用 最 近 产 生 错 误 的 说 明 : 


call WritewindowsMsg 


ReadHex ReadHex 过 程 从 键盘 读 取 一 个 32 位 十 六 进 制 整数 ， 并 用 EAX 返回 相应 的 
二 进 制 数 。 对 无 效 字符 不 进行 任何 错误 检查 。 字 母 A 到 下 的 大 小 写 都 可 以 使 用 。 最 多 能 够 
输入 8 个 数字 (超出 的 字符 将 被 忽略 )， 前 导 空 格 将 被 忽略 。 调 用 示例 如 下 : 


.data 

hexVal DWORD ? 
.code 

call ReadHex 
mov hexVal,eax 


Readlnt ”ReadInt 过 程 从 键盘 读 取 一 个 32 位 有 符号 整数 ， 并 用 EAX 返回 该 值 。 用 户 
可 以 键 和 人前 置 加 号 或 减 号 ， 而 其 后 跟 的 只 能 是 数字 。ReadInt 设置 溢出 标志 位 ， 如 果 输 入 
数值 无 法 表示 为 32 位 有 符号 数 (范围 -2 147 483 648 至 +2 147 483 647 )， 则 显示 一 个 错 
误 信息 。 返 回 值 包括 所 有 的 有 效 数 字 ， 直 到 遇见 第 一 个 非 数 字 字 符 。 例 如 ， 如 果 用 户 输入 
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+123ABC， 则 返回 值 为 +123。 调 用 示例 如 下 : 


.data 

intVal SDWORD ? 
.Code 

call ReadInt 
mov intVal,eax 


ReadKey ReadKey 过 程 执行 无 等 待 键盘 检查 。 换 句 话 说 ， 它 检查 键盘 输入 缓冲 区 以 
查看 用 户 是 否 有 按键 操作 。 如 果 没 有 发 现 键 盘 数 据 ， 则 零 标志 位 置 1。 如 果 ReadKey 发 现 有 
按键 ， 则 清除 零 标志 位 ， 且 向 AL 送 入 0 或 ASCII 码 。 若 AL 为 0， 表示 用 户 可 能 按 下 了 一 
个 特殊 键 (功能 键 、 方 向 键 等 )。AH 寄存 器 为 虚拟 扫描 码 ，DX 为 虚拟 键 码 ，EBX 为 键盘 标 
志 位 。 下 述 伪 代 码 说 明了 调用 ReadKey 时 的 各 种 结果 : 


if no_keyboard data then 





ZF =1 
else 
ZF = 0 


if AL = 0 then 
extended key was pressed, and AH = scan code, DX = virtual 
key code, and EBX = keyboard flag bits 
else 
al = the key's ASCIT code 
endif 
endif 


当 调 用 ReadKey 时 ，EAX 和 EDX 的 高 16 位 会 被 覆盖 。 

ReadString ReadString 过 程 从 键盘 读 取 一 个 字符 串 ， 直 到 用 户 键入 回 车 键 。 过 程 用 
EDX 传递 缓冲 区 的 偏 移 量 ， 用 ECX 传递 用 户 能 键入 的 最 大 字符 数 加 1 (保留 给 终止 空 字 节 )， 
用 EAX 返回 用 户 键入 的 字符 数 。 示 例 调用 如 下 : 


data 
buffer BYTE 21 DUP(0) ; 输入 缓冲 区 
byteCount DWORD ? ;? 定义 计数 器 
.Code 


mov edx,OFFSET buffer  ; 指向 缓冲 区 
mov ecx,SIZEOF buffer ;定义 最 大 字符 数 
call ReadString ; 输入 字符 串 
mov byteCount,eax ; 字符 数 


ReadString 在 内 存 中 字符 串 的 末尾 自动 插入 一 个 null 终 止 符 。 用 户 输入 “ ABCDEFG” 
buffer 中 前 8 个 字 节 的 十 六 进 制 形式 和 ASCII 形式 如 下 所 示 : 


变量 byteCount 等 于 7。 

SetTextColor SetTextColor 过 程 ( 仅 在 Irvine32 链接 库 中 ) 设置 输出 文本 的 前 景色 和 
背景 色 。 调 用 SetTextColor 时 ， 给 EAX 分配 一 个 颜色 属性 。 下 列 预定 义 的 颜色 常数 都 可 以 
用 于 前 景色 和 背景 色 : 


yn 


ee TI 


hamony -7 
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颜色 常量 在 Irvine32.inc 文件 中 进行 定义 。 要 获得 完整 的 颜色 字 节 数值 ， 就 将 背景 色 乘 
以 16 再 加 上 前 景色 。 例如， 下 述 常量 表示 在 蓝 色 背景 上 输出 黄色 字符 : 


yellow + (blue * 16) 


下 列 语句 设置 为 蓝 色 背景 上 输出 白色 字符 : 


mov eax,white - (blue * 16)  ; 蓝 底 白字 
call SetTextColor 


男 一 种 表示 颜色 常量 的 方法 是 使 用 SHL 运算 符 , 将 背景 色 左 移 4 位 再 加 上 前 景色 。 


Yellow + (blue SHL 4) 


位 移 是 在 汇编 时 执行 的 ， 因 此 它 只 能 用 常数 作 操 作 数 。 第 7 章 将 会 学 习 如 何在 执行 时 进 
行 整数 移 位 。16.3.2 节 的 视频 属性 还 有 详细 说 明 。 

Str_length ”Str_length 过 程 返回 空 字 节 结 束 的 字符 串 的 长 度 。 过 程 用 EDX 传递 字符 串 
的 偏 移 量 ， 用 EAX 返回 字符 串 的 长 度 。 调 用 示例 如 下 : 

.data 


buffer BYTE "abcde",0 
bufLength DWORD ? 


.code 

mov edx,OFFSET buffer ;指向 字符 哇 
call Str_length ?EAX=5 
mov bufLength,eax ; 保存 长 度 


WaitMsg WaitMsg 过 程 显示 “ Press any key to continue…” 消 息 ， 并 等 待 用 户 按 键 。 
当 用 户 想 在 数据 滚动 和 消失 之 前 暂停 屏幕 显示 时 ， 这 个 过 程 就 很 有 有 用。 过 程 没 有 输入 参数 。 


call WaitMsg 


WriteBin ”WriteBin 过 程 以 ASCII 二 进 制 格式 向 控制 台 窗 口 输出 一 个 整数 。 过 程 用 
EAX 传递 该 整数 。 为 了 便于 阅读 ， 二 进 制 位 以 四 位 一 组 的 形式 进行 显示 。 调 用 示例 如 下 : 


mov eax, 12346AF9h 
call WriteBin 


示例 代码 显示 如 下 : 
0001 0010 0011 0100 0110 1010 1111 1001 


WriteBinB ”WriteBinB 过 程 以 ASCII 二 进 制 格式 向 控制 台 窗 口 输出 一 个 32 位 整数 。 过 
程 用 EAX 寄存 器 传递 该 整数 ， 用 EDX 表示 以 字 节 为 单位 的 显示 大 小 (1、2, 或 4)。 为 了 
便于 阅读 ， 二 进 制 位 以 四 位 一 组 的 形式 进行 显示 。 调 用 示例 如 下 : 

mov eax,00001234h 

mov ebx,TYPE WORD ; 两 个 字 节 

call WriteBinB 7 显示 0001 0010 0011 0100 

WriteChar WriteChar 过 程 向 控制 台 窗 口 写 一 个 字符 。 过 程 用 AL 传递 字符 (或 其 
ASCII 码 ) 。 调 用 示例 如 下 : 


mov al,'A 
call WriteChar > 时 
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WriteDec ”WriteDec 过 程 以 十 进 制 格式 向 控制 台 窗口 输出 一 个 32 位 无 符号 整数 ， 且 没 


有 前 置 0。 过 程 用 EAX 寄存 器 传递 该 整数 。 调 用 示例 如 下 : 


mov eax,295 
call WriteDec 三 昌 示 "295" 


WriteHex “WriteHex 过 程 以 8 位 十 六 进 制 格式 向 控制 台 窗 口 输出 一 个 32 位 无 符号 整 


， 如 果 需 要 ， 应 插入 前 置 0。 过 程 用 EAX 传递 整数 。 调 用 示例 如 下 : 


mov eax, 7FFFh 
call WriteHex 7 显示 : "00007FFF" 


WriteHexB WriteHexB 过 程 以 十 六 进 制 格式 向 控制 台 窗口 输出 一 个 32 位 无 符号 整数 ， 


如 果 需 要 ， 应 插入 前 置 0。 过 程 用 EAX 传递 整数 ， 用 EBX 表示 显示 格式 的 字 节 数 (1、2， 
或 4)。 调 用 示例 如 下 : 


mov eax,7FFFh 


mov ebx,TYPE WORD ; 两 个 字 节 
call WriteHexB 7 显示 : “7EFFE” 


Writelnt ”WriteInt 过 程 以 十 进 制 向 控制 台 窗口 输出 一 个 32 位 有 符号 整数 ， 有 前 置 符 


号 ， 但 没有 前 置 0。 过 程 用 EAX 传递 整数 。 调 用 示例 如 下 : 


mov eax,216543 
call WriteInt ; 显示 : "+216543" 


WriteString ”WriteString 过 程 向 操作 台 窗 口 输出 一 个 空 字 节 结 束 的 字符 串 。 过 程 用 


EDX 传递 字符 串 的 偏 移 量 。 调 用 示例 如 下 : 


.data 

prompt BYTE "Enter your name: ",0 
.Code 

mov edx,OFFSET prompt 

call WriteString 


WriteToFile WriteToFile 过 程 向 一 个 输出 文件 写 人 缓冲 区 内 容 。 过 程 用 EAX 传递 有 效 


的 文件 句柄 ， 用 EDX 传递 缓冲 区 偏 移 量 ， 用 ECX 传递 写 人 的 字 节 数 。 当 过 程 返 回 时 ， 如 果 
EAX 大 于 0， 则 其 包含 的 是 写 入 的 字 节 数 ; 否则 ， 发 生 错 误 。 下 述 代码 调用 了 WriteToFile: 


BUFFER SIZE = 5000 


.data 
fileHandle DWORD ? 
buffer BYTE BUFFER SIZE DUP(?) 


.Code 

mov eax,fileHandle 
mov edx,OFFSET buffer 
mov eCx,BUFFER SIZE 
call WriteToFile 


下 面 的 伪 代 码 说 明了 调用 WriteToFile 之 后 对 EAX 返回 值 的 处 理 : 


if EAX = 0 then 

error occurred when writing to file 

Call WriteWindowsMessage to see the error 
else 

EAX = number of bytes written to the file 
endif 


WriteWindowsMsg WriteWindowsMsg 过 程 向 控制 台 窗 口 输出 应 用 程序 在 调用 系统 函 
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数 时 最 近 产 生 的 错误 信息 。 调 用 示例 如 下 : 


call WriteWindowsMsg 


下 面 的 例子 展示 了 一 个 消息 字符 串 : 


Error 2: The system cannot find the file specified. 


5.4.4 ” 库 测 试 程序 


教程 : 库 测试 #1 

本 实践 教程 编写 一 个 程序 ， 演 示 用 屏幕 颜色 输入 / 输出 整数 。 
步骤 1: 用 标准 头 部 开始 程序 : 

; 库 测 试 #1: 整数 TI/O(InputLoop -asm) 


;? 测试 CLrscr，Crlf，DumpMem，ReadInt，SetTextColor， 
:WaitMsg, WriteBin, WriteHex 和 WriteString 过 程 。 


步骤 2 : 声明 COUNT 常量 ， 以 便 之 后 确定 程序 循环 重复 的 次 数 。 然 后 再 定义 两 个 常量 
BlueTextOnGray 和 DefaultColor， 当 需要 修改 控制 台 窗口 颜色 时 可 以 使 用 它们 。 背 景色 存放 
在 颜色 字 节 的 高 4 位 ， 前 景色 (文本 ) 存放 在 颜色 字 节 的 低 4 位 。 虽 然 还 没有 讨论 位 移 指令 ， 
但 是 可 以 通过 将 背景 色 移动 到 颜色 属性 字 节 的 高 4 位 来 实现 背景 色 乘 16: 


data 

COUNT = 4 

BlueTextOnGray = blue + (lightGray * 16) 
DefaultColor = lightGray + (black * 16) 


步骤 3 : 用 十 六 进 制 常数 声明 一 个 有 符号 双 字 整数 数组 。 此 外 ， 还 要 定义 一 个 字符 串 ， 
在 程序 需要 用 户 输入 整数 时 作为 提示 : 

arrayD SDWORD 12345678h,1A4B2000h,3434h,7AB9h 

prompt BYTE "Enter a 32-bit signed integer: ",0 

步骤 4: 在 代码 段 定义 主 程序 ,编写 代码 将 EAX 初始 化 为 浅 灰 色 背 景 和 蓝 色 文 本 。 在 程 
序 执行 时 ，SetTextColor 过 程 将 从 其 被 调用 开始 改变 窗口 中 所 有 输出 文本 的 前 景色 和 背景 色 : 


.Code 

main PROC 
mov eax,BlueTextOnGray 
call SetTextColor 


如 果 要 把 控制 台 窗口 背 景色 设置 为 新 的 颜色 ， 就 必须 使 用 Clrscr 过 程 来 清 屏 : 


call Clrscr ; 清 屏 


接 下 来 ,程序 将 显示 由 变量 arrayD 定义 的 内 存 中 的 一 组 双 字 数值 。DumpMem 过 程 


需要 用 ESI、EBX 和 ECX 寄存 器 传递 参数 。 
步骤 5: 将 arrayD 的 偏 移 量 赋 给 ESI， 用 于 标识 显示 数据 区 的 起 始 位 置 : 


mov esi,OFFSET arrayD 


步骤 6 : EBX 的 值 是 一 个 整数 ， 指 定 每 个 数组 元 素 的 大 小 。 由 于 要 显示 的 是 双 字 数组 ， 
因此 EBX 等 于 4。 该 值 由 表达 式 TYPE arrayD 返回 : 
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mov ebx,TYPE arrayD ; 双 字 =4 字 节 


步骤 7 : 利用 LENGTHOF 运算 符 ，ECX 设置 为 被 显示 单元 的 个 数 。 然 后 ， 当 调用 
DumpMem 时 ， 过 程 需要 的 所 有 信息 就 都 已 经 准备 好 了 : 


mov ecx,LENGTHOF arrayD ;arrayD 中 的 单元 数 
call DumpMem ; 显示 内 存 区 


下 图 展示 了 DumpMem 产生 的 输出 : 


Dump of offset 00405000 


12345678 1A4B2000 00003434 00007AB9 


接 下 来 ， 将 请 求 用 户 输 入 4 个 有 符号 整数 。 每 输入 一 个 整数 ， 该 数 将 以 有 符号 十 进 
制 、 十 六 进 制 和 二 进 制 的 形式 显示 出 来 。 





步骤 8: 调用 Crlf 过 程 输出 一 个 空 行 。 接 着 ,将 ECX 初始 化 为 常数 COUNT ， 使 之 成 为 
后 续 执行 的 循环 计数 器 : 

call Crif 

mov ecx,COUNT 


步骤 9: 程序 需要 显示 一 个 字符 串 来 请 求 用 户 输 入 一 个 整数 。 将 字符 串 偏 移 量 赋 给 EDX 
并 调用 WriteString 过 程 。 然 后 ， 调 用 ReadInt 过 程 接收 用 户 输入 ， 该 数 将 自动 保存 到 EAX: 


Ll: mov edx,OFFSET prompt 
call Writestring 
call ReadInt ; 输入 数据 存 入 EAX 
all ‘Crlf ; 显示 一 个 新 空白 行 


步骤 10 : 调用 WriteInt 过 程 ， 将 EAX 中 的 整数 显示 为 有 符号 十 进 制 形式 。 再 调用 Crlf 
将 光标 移动 到 下 一 个 输出 行 : 

call WriteInt  ; 显示 为 有 符号 十 进 制 

call ‘Crlf 

步骤 11 : 分 别 调用 WriteHex 和 WriteBin 过 程 ， 将 同样 的 数 ( 仍 保存 在 EAX 中 ) 显示 
为 十 六 进 制 和 二 进 制 形式 : 


call WriteHex ; 显示 为 十 六 进 制 
Sail CrlE 

call WriteBin  ; 显示 为 二 进 制 
call CZlE 

wall “CELE 


步骤 12 : 插入 一 条 Loop 指令 ,使 程序 从 标号 Ll 处 开始 循环 。 该 指令 先 将 ECX 减 1， 
当 且 仅 当 ECX 不 等 于 0 时 ， 跳 转 到 标号 L1: 


Loop Ll ;重复 循环 


步骤 13 : 循环 结束 后 ， 想 显示 一 条 “Press any key…” 消 息 ， 然 后 暂停 输出 ， 等 待 用 户 
按键 。 要 实现 这 个 功能 ， 调 用 WaitMsg 过 程 : 


call WaitMsg ; "Press any key..." 


步骤 14: 在 程序 结束 之 前 ， 控 制 台 窗口 属性 返回 为 默认 颜色 (黑色 背景 浅 灰 字符 )。 
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mov eax, DefaultColor 
call SetTextColor 
Gall CIESGE 


下 述 代 码 结束 程序 : 

main es 

END main 

按照 用 户 输入 的 4 个 整数 ， 程 序 余下 的 输出 如 下 图 所 示 : 72] 


Enter a 32-bit signed integer: -42 

-42 

FFFFFFD6 

TRL TE ETL TLL TIL TLL TON ONLO 
Enter a 32-bit signed integer: 36 

十 36 

00000024 

0000 0000 0000 0000 0000 0000 0010 0100 


Enter a 32-bit signed integer: 244324 
+244324 

0003BA64 

0000 0000 0000 0011 1011 1010 0110 0100 


Enter a 32-bit signed integer: -7979779 
-7979779 
FF863CFD 
L111 11i11 1000. 0110 0011 1100 i111 1101 





完整 的 程序 清单 如 下 ， 其 中 添加 了 一 些 注释 行 : 


; 库 测试 #1: 整数 I/0 (InputLoop.asm) 
; 测试 Clrscr, Crlf, DumpMem, ReadInt, SetTextColor, 


;WaitMsg, WriteBin, WriteHex 和 WriteString 过 程 。 
include Irvine32.inc 


.data 

COUNT = 4 

BlueTextOnGray = blue + (lightGray * 16) 
DefaultColor = lightGray + (black * 16) 

arrayD SDWORD 12345678h,1A4B2000h,3434h,7AB9h 
prompt BYTE "Enter a 32-bit signed integer: ",0 


.code 
main PROC 


; 选择 浅 灰 背景 蓝 色 文本 
mov eax,BlueTextOnGray 


call SetTextColor 
call Clrscr ; 清 屏 


;用 DumpMem 显示 数组 


mov esi,OFFSET arrayD ;? 开始 位 置 的 OFFSET 
mov ebx,TYPE arrayD ; 双 字 =4 字 节 

mov ecx,LENGTHOF arrayD ;arrayD 中 的 单元 数 
call DumpMem ; 显示 内 存在 


; 请 求 用 户 输入 一 组 有 符号 整数 173 
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all 
mov 


Ll: mov 
call 
call 
call 


Crlf 
ecx,COUNT 


edx,OFFSET prompt 
WriteString 
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; 显示 一 个 新 空白 行 


ReadInt 
EX 人 


; 输入 数据 存 入 EAX 
; 显示 一 个 新 空白 行 


7 用 十 进 制 ， 十 六 进 制 和 二 进 制 显示 整数 


call 
call 
call 
call 
call 
call 
Gall 
Loop 


WriteInt 
CT 下 
WriteHex 
Crif 
WriteBin 
Crlf 
crif 

Ll1 


;显示 为 有 符号 十 进 制 
; 显示 为 十 六 进 制 
; 显示 为 二 进 制 


; 重复 循环 


; 返回 控制 台 窗 口 的 默认 颜色 


call 
mov 
call 
call 
exit 
main ENDP 
END main 


库 测试 #2: 随机 整数 


WaitMsg 


; "Press any key..." 


eax,DefaultColor 


SetTextColor 


Clrscr 


现在 来 看 第 二 个 库 测试 程序 演示 链接 库 的 随机 数 生成 功能 ， 并 引入 Call 指令 (详细 说 
明 参 见 5.5 节 )。 第 一 步 ， 程 序 在 0 到 4 294 967 294 之 间 ， 随 机 生成 10 个 无 符号 整数 。 第 
二 步 ， 程 序 在 -50 到 +49 之 间 生 成 10 个 有 符号 整数 : 


; 链接 库 测试 #2TestLib2 .asm 
; 测试 Irvine32 链接 库 的 过 程 。 


include Irvine32.inc 


TAB = 9 


“Code 

main PROC 
call 
call 
call 
exit 

main ENDP 


Randl PROC 


Randomize 
Randl 
Rand2 


; 生成 10 个 伪 随 机 整数 。 


mov 
Ll: call 
call 
mov 


call 
loop 


call 
ret 
Randl ENDP 


Rand2 PROC 


ecx,10 
Random32 


WriteDec 
al,TAB 
WriteChar 
Ll1 


Ceris 


; Tab 的 ASCII 码 


; 初始 化 随机 生成 器 


; 循环 10 次 
; 生成 随机 整数 


;用 无 符号 十 进 制 形式 输出 
; 水 平 制 表 符 
; 输出 制 表 符 


; 在 -50 到 +49 之 间 生 成 10 个 伪 随 机 整数 


mov 


ecx,10 


; 循环 10 次 
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Ll: mov eax,100 ;? 数值 范围 0~99 
call RandomRange ;生成 随机 整数 
sub eax,50 ; 数值 范围 -50 到 +49 
call WriteInt 7 用 有 符号 十 进 制 形式 输出 
mov al,TAB 7 水 平 制 表 符 
call WriteChar ; 输出 制 表 符 
loop Ll1 
Sall ‘CrLE 
ret 
Rand2 ENDP 
END main 
程序 示例 输出 如 下 所 示 : 


3221236194 2210931702 974700167 367494257 2227888607 


926772240 506254858 1769123448 2288603673 736071794 
-34 +27 +38 -34 党 3 -13 -29 





库 测 试 #3: 性 能 计时 

汇编 语言 常常 用 于 优化 那些 被 视 为 对 程序 性 能 非常 关键 的 代码 。 本 书 链接 库 中 
的 GetMseconds 过 程 能 返回 从 午夜 之 后 经 过 的 毫秒 数 。 在 第 3 个 库 测试 程序 中 ， 调 用 
GetMseconds ， 执 行 一 个 嵌 套 循环 ， 然 后 再 一 次 调用 GetMSeconds。 两 次 过 程 调用 返回 不 同 
的 值 ， 给 出 了 内 套 循环 花费 的 时 间 : 

; 链接 库 测 试 #3 (TestLib3.asm) 

; 计算 典 套 循环 的 执行 时 间 

include Irvine32.inc 


.data 
OUTER LOOP_COUNT = 3 
startTime DWORD ? 





msgl byte "Please wait...",0dh,0ah,0 
msg2 byte "Elapsed milliseconds: ",0 
.code [175] 
main PROC 
mov edx,OFFSET msgl ; "Please wait..." 
call WriteString 
; 保存 开始 时 间 


call GetMSeconds 
mov startTime,eax 


; 开始 外 层 循环 
mov ecx,OUTER LOOP_COUNT 


Ll: call innerLoop 
loop Ll 


; 计算 执行 时 间 


call GetMSeconds 
sub eax,startTime 


;显示 执行 时 间 


mov edx,OFFSET msg2 ; "Elapsed milliseconds: " 
call WriteString 
call WriteDec ; 输出 毫秒 数 


GAaLL CEE 
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exit 


main ENDP 
innerLoop PROC 
push ecx ; 保存 当前 ECX 的 值 
mov ecx,O0FFFFFFFh ;? 设置 循环 计数 器 
L1: mul eax ; 使 用 了 一 些 周期 
mul eax 
mul eax 
loop L1 ; 重复 内 循环 
POP ecx ; 恢复 ECX 被 保存 的 值 
ret 


innerLoop ENDP 


END main 


在 Intel Core Duo 处 理 器 上 运行 该 程序 的 示例 输出 如 下 : 


Please wait.... 


Elapsed milliseconds: 4974 


程序 的 详细 分 析 
现在 来 仔细 研究 一 下 库 测试 #3 程序。main 过 程 在 控制 台 窗 口中 显示 字符 串 “ Please 
wait …”: 


main PROC 
mov edx,OFFSET msgl ; "Please wait..." 
call WriteString 


调用 GetMSeconds 时 ， 过 程 用 EAX 寄存 器 返回 从 午夜 开始 经 过 的 毫秒 数 。 为 了 后 续 的 
使 用 ， 该 数值 被 保存 到 一 个 变量 里 : 


call GetMSeconds 
‘mov startTime,eax 


接 下 来 ， 以 OUTER_ LOOP_COUNT 的 值 为 基础 创建 一 个 循环 。 该 值 被 送 入 ECX， 用 
于 之 后 出 现 的 LOOP 指令 : 


mov ecx,OUTER LOOP COUNT 


循环 在 标号 L1 处 开始 ， 调 用 innerLoop 过 程 。 这 条 CALL 指令 将 一 直 重 复 ， 直 到 ECX 
递减 到 0 为止 : 


Ll: call innerLoop 
loop Ll 


innerLoop 过 程 用 指令 PUSH 将 ECX 保存 到 堆栈 ， 再 对 其 赋 新 值 。( PUSH 和 POP 指令 
已 经 在 5.1.2 节 讨 论 过 了 。) 然后 ,循环 本 身 有 一 些 指 令 ， 设计 用 来 使 用 一 些 时 钟 周期 : 


innerLoop PROC 


push ecx ; 保存 当前 ECX 的 值 
mov ”ecx,0FFFFFFFh  ; 设置 循环 计数 器 
Ll: mul eax ; 使 用 一 些 周期 


mul eax 
mul eax 


loop Ll ; 重复 内 循环 
这 条 LOOP 指令 会 把 ECX 递减 到 0， 因 此 我 们 将 被 保留 的 ECX 值 弹出 堆栈 。 所 以 在 结 


过 程 139 


束 过程 时 ，ECX 中 的 值 与 进入 过 程 时 相同 。PUSH 和 POP 指令 序列 很 重要 ， 因 为 main 过 程 
在 调用 innerLoop 时 是 用 ECX 作为 循环 计数 器 的 。innerLoop 的 最 后 几 行 如 下 所 示 : 
Pop ecx ;恢复 ECX 被 保存 的 值 
ret 
innerLoop ENDP 
循环 结束 后 回 到 main 过 程 ， 调 用 GetMSeconds， 用 EAX 返回 其 结果 。 现 在 程序 要 做 
的 就 是 用 该 值 减 去 开始 时 间 ， 从 而 获得 两 次 调用 GetMSeconds 之 间 经 过 的 毫秒 数 : 
call GetMSeconds 
sub eax,startTime 
程序 显示 一 个 新 的 字符 串 信息 ， 然 后 输出 EAX 中 的 数值 ， 以 显示 经 过 的 毫秒 数 : 


mov edx,OFFSET msg2 ; "Elapsed milliseconds: ” 
call WriteString 


call WriteDec 7; 显示 EAX 中 的 数值 
Call CrlE 
exit 

main ENDP 


5.4.5 ”本 节 回 顾 


1. 链接 库 中 的 哪个 过 程 在 指定 范围 内 生成 随机 整数 ? 

2. 链接 库 中 的 哪个 过 程 显示 “Press [Enter] to continue…” 并 等 待 用 户 按 下 Enter 键 ? 
3. 编写 语句 使 程序 暂停 700 毫秒 。 

4. 链接 库 中 的 哪个 过 程 以 十 进 制 形式 向 控制 台 窗口 输出 无 符号 整数 ? 

5. 链接 库 中 的 哪个 过 程 将 光标 定位 到 控制 台 窗 口 的 指定 位 置 ? 

6. 编写 使 用 Irvine32 链接 库 时 所 需 的 INCLUDE 伪 指 令 。 

7. Irvine32.inc 文件 中 包含 哪些 类 型 的 语句 ? 

8. DumpMem 过 程 需要 哪些 输入 参数 ? 

9. ReadString 过 程 需要 哪些 输入 参数 ? 

10. DumpRegs 过 程 显示 哪些 处 理 器 状态 标志 位 ? 

11. 挑战 :编写 语句 提示 用 户 输入 标识 号 ， 并 向 字 节 数组 输入 一 串 数字 。 


5.5 ”64 位 汇编 编程 


5.5.1 Irvine64 链接 库 


本 书 提供 了 一 个 能 支持 64 位 编程 的 最 小 链接 库 ， 其 中 包含 了 如 下 过 程 

e Crlf: 向 控制 台 写 一 个 行 结束 的 序列 。 

e Random64 : 在 0 一 24-1 内 ,生成 一 个 64 位 的 伪 随 机 整数 。 随 机 数值 用 RAX 寄存 
兢 人 返回。 

e Randomize: 用 一 个 值 作 为 随机 数 生成 器 的 种 子 。 

e ReadInt64 : 从 键盘 读 取 一 个 64 位 有 符号 整数 ， 用 回 车 符 结 束 。 数 值 用 RAX 寄存 器 
返回 。 

e ReadString : 从 键盘 读 取 一 个 字符 串 ， 用 回 车 符 结束 。 过 程 用 RDX 传递 输入 缓冲 器 
偏 移 量 ; 用 RCX 传递 用 户 可 输入 的 最 大 字符 数 加 1 (用 于 null 结束 符 字 节 )。 返 回 值 
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(用 RAX) 为 用 户 实际 输入 的 字符 数 。 
e Str_ compare : 比较 两 个 字符 串 。 过 程 将 源 串 指针 传递 给 RSI， 将 目的 串 指 针 传 递 给 
RDI。 用 与 CMP (比较 ) 指令 一 样 的 方式 设置 零 标志 位 和 进位 标志 位 。 
Str_copy : 将 一 个 源 串 复制 到 目标 指针 指定 的 位 置 。 源 串 偏 移 量 传递 给 RSI， 目 标 偏 
移 量 传递 给 RDI。 
e Str_length : 用 RAX 寄存 器 返回 一 个 空 字 节 结束 的 字符 串 的 长 度 。 过 程 用 RCX 传递 
字符 串 的 偏 移 量 。 
e WriteInt64 : 将 RAX 寄存 器 中 的 内 容 显示 为 64 位 有 符号 十 进 制 数 ， 并 加 上 前 置 加 号 
或 减 号 。 过 程 没 有 返回 值 。 
e WriteHex64: 将 RAX 寄存 器 中 的 内 容 显 示 为 64 位 十 六 进 制 数 。 过 程 没 有 返回 值 。 
WriteHexB : 将 RAX 寄存 器 中 的 内 容 显示 为 1 字 节 、2 字 节 、4 字 节 或 8 字 节 的 十 六 
进 制 数 。 将 显示 的 大 小 ( 1、2、4 或 8 ) 传递 给 RBX 寄存 器 。 过 程 没有 返回 值 。 
e WriteString : 显示 一 个 空 字 节 结束 的 ASCII 字符 串 。 将 字符 串 的 64 位 偏 移 量 传递 给 
RDX。 过 程 没有 返回 值 。 
尽管 这 个 库 比 32 位 链接 库 小 很 多 ， 它 还 是 包含 了 许多 重要 工具 能 使 得 程序 更 具 互 动 性 。 
随 着 学 习 的 深入 ， 本 书 还 鼓励 读者 用 自己 的 代码 来 扩展 这 个 链接 库 。Irvine64 链接 库 会 保留 
RBX、RBP、RDI、RSI、R12、R13、R14 和 R15 寄存 器 的 值 ， 反 之 ，RAX、RCX、RDX、 
R8、R9、R10 和 R11 寄存 器 的 值 则 不 会 保留 。 


5.5.2 调用 64 位 子 程序 


如 果 想 要 调用 自己 编写 的 子 程序 ， 或 是 Irvine64 链接 库 中 的 子 程序 ， 则 程序 员 需 要 做 的 
就 是 将 输入 参数 送 入 寄存 器 ， 并 执行 CALL 指令 。 比 如 : 

mov rax,12345678h 

Sml WriteHex64 

还 有 一 件 小 事 也 需要 完成 ， 即 程序 员 要 在 自己 程序 的 顶部 用 PROTO 伪 指 令 指定 所 有 在 
本 程序 之 外 同时 又 将 会 被 调用 的 过 程 : 


ExitProcess PROTO ;位 于 Windows API 
WriteHex64 PROTO ; 位 于 Irvine64 链接 库 


5.5.3 x64 调用 规范 


Microsoft 在 64 位 程序 中 使 用 统一 模式 来 传递 参数 并 调用 过 程 ， 称 为 Microsoft x64 调 
用 规范 。 该 规范 由 C/C++ 编译 器 和 Windows 应 用 编程 接口 (API) 使 用 。 程 序 员 只 有 在 调用 
Windows API 的 函数 或 用 C/C++ 编写 的 函数 时 ， 才 会 使 用 这 个 调用 规范 。 该 调用 规范 的 一 
些 基本 特性 如 下 所 示 : 

1 ) CALL 指令 将 RSP (堆栈 指针 ) 寄存 器 减 8， 因 为 地 址 是 64 位 的 。 

2 ) 前 四 个 参数 依 序 存 人 RCX、RDX、R8 和 R9 寄存 器 ， 并 传递 给 过 程 。 如 果 只 有 一 个 
参数 ， 则 将 其 放 人 RCX。 如 果 还 有 第 二 个 参数 ， 则 将 其 放 入 RDX， 以 此 类 推 。 其 他 参数 ， 
按照 从 左 到 右 的 顺序 压 人 堆栈。 

3 ) 调用 者 的 责任 还 包括 在 运行 时 堆栈 分 配 至 少 32 字 节 的 影子 空间 (shadow space)， 这 
样 ， 被 调用 的 过 程 就 可 以 选择 将 寄存 器 参数 保存 在 这 个 区 域 中 。 
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4 ) 在 调用 子 程序 时 ,堆栈 指针 ( RSP) 必须 进行 16 字 节 边界 对 齐 ( 16 的 倍数 )。CALL 
指令 把 8 字 节 的 返回 值 压 入 堆栈 . 因此， 除了 已 经 减 去 的 影子 空间 的 32 之 外 ,调用 程序 还 
必须 从 堆栈 指针 中 减 去 8。 后 面 的 示例 将 显示 如 何 实现 这 些 操作 。 

x64 调用 规范 的 其 他 细节 将 在 第 8 章 进行 介绍 ， 届 时 会 更 详细 地 讨论 运行 时 堆栈 。 这 里 
有 个 好 消息 : 调用 Irvine64 链接 库 中 的 子 程序 时 ， 不 需 使 用 Microsoft x64 调用 规范 ; 只 在 
调用 Windows API 函数 时 使 用 它 。 


5.5.4 调用 过 程 示例 


现在 编写 一 段 小 程序 ， 使 用 Microsoft x64 调用 规范 来 调用 子 程序 AddFour。 这 个 子 程 
序 将 四 个 参数 寄存 器 (RCX、RDX、R8 和 R9 ) 的 内 容 相 加 ， 并 将 和 数 保 存 到 RAX。 由 于 
过 程 通常 使 用 RAX 返回 结果 ， 因 此 ， 当 从 子 程序 返回 时 ， 调 用 程序 也 期 望 返回 值 在 这 个 寄 
存 器 中 。 这 样 就 可 以 说 这 个 子 程序 是 一 个 函数 ， 因 为 ， 它 接收 了 四 个 输入 并 (确切 地 说 ) 产 
生 了 一 个 输出 。 


1: ; 在 64 模式 下 调用 子 程序 (CallProc 64.asm) 
2: ;第 5 章 示 例 

3: 

4: ExitProcess PROTO 

5: WriteInt64 PROTO ;Irvine64 链接 库 
6: Crlf PROTO ;Irvine64 链接 库 
8: .code 

9: main PROC 

10: sub rsp,8 ; 对 准 堆栈 指针 
11: sub rsp,20h ; 为 影子 参数 保留 32 个 字 节 
123: 

ee mov rcx,l ; 依 序 传递 参数 
14: mov rdx,2 

158 mov rr8,3 

16’s mov r9,4 

17's call AddFour ; 在 RAX 中 查找 返回 值 
18: call WriteIint64 ; 显示 数字 

19.s Call Crif ; 输出 回 车 换行 符 
20 : 

R13 mov ecx,0 

22% call ExitProcess 

23: main ENDP 

24: 

25: AddFour PROC 

263 mov rax,rex 

8 add rax,rdx 

28: add rax,r8 

29: add rax,r9 ; 和 数 保存 在 RAX 中 
30;: ret 

31: AddFour ENDP 

S28 

33: END 


现在 来 看 看 本 例 中 的 其 他 细节 : 第 10 行 将 堆栈 指针 对 齐 到 16 字 节 的 偶数 边界 。 为 什么 


要 这 样 做 ? 在 OS 调用 主 程序 之 前 ， 假 设 堆栈 指针 是 对 齐 16 字 节 边界 的 。 然 后 ， 当 OS 调用 [1& 


主 程序 时 ，CALL 指令 将 8 字 节 的 返回 地 址 压 入 堆栈 。 将 堆栈 指针 再 减 去 8， 使 其 减少 成 一 
个 16 的 倍数 。 
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可 以 在 Visual Studio 调试 器 中 运行 该 程序 ， 并 查看 RSP 寄存 器 (堆栈 指针 ) 改变 数值 。 
通过 这 个 方法 ， 能 够 看 到 用 图 形 方 式 在 图 5-11 中 展示 的 十 六 进 制 数值 。 该 图 只 展示 了 每 个 
地 址 的 低 32 位 ， 因 为 高 32 位 为 全 零 : 

















1 ) 执行 第 10 行 前 ，RSP=01AFE48。 这 表示 在 eed 
OS 调用 本 程序 之 前 ，RSP 等 于 01AFE50。( CALL 人 ee 
指令 使 得 堆栈 指针 减 8.) 01AFE30 
2 ) 执行 第 10 行 后 ，RSP=01AFE40， 表 示 堆 栈 01AFE28 
正好 对 齐 到 16 字 节 边界 。 01AFE20 
3 ) 执行 第 11 行 后 ，RSP=01AFE20， 表 示 32 01AFE18 


个 字 节 的 影子 空间 位 置 从 01AFE20 到 01AFE3F。 
4) 在 AddFour 过 程 中 ，RSP=01AFE18， 表示 
调用 者 的 返回 地 址 已 经 压 人 堆栈 。 
5) 从 AddFour 返回 后 ，RSP 再 一 次 等 于 01AFE20， 与 调用 AddFour 之 前 的 值 相同 。 
与 调用 ExitProcess 来 结束 程序 相 比 ， 本 程序 选择 的 是 执行 RET 指令 ， 这 将 返回 到 启动 
本 程序 的 过 程 。 但 是 ， 这 也 就 要 求 能 将 堆栈 指针 恢复 到 其 在 main 过 程 开始 执行 时 的 位 置 。 
下 面 的 代码 行 能 替代 CallProc 64 程序 的 第 21 和 22 行 : 


图 5-11 CallProc_ 64 程序 的 运行 时 堆栈 


21: add rsp,28 ;恢复 堆栈 指针 
22: mov ecx,0 ; 过 程 返 回 码 
23: ret ; 返回 0S 


提示 “要 使 用 lrvine64 链接 库 ， 将 Irvine64.obj 文件 添加 到 用 户 的 Visual Studio 项 


目 中 。Visual Studio 中 的 操作 步骤 如 下 : 在 Solution Explorer 窗口 中 右键 点 击 项 目 名 称 ， 
选择 Add， 选 择 Existing ltem， 再 选择 Irvine64.obj 文件 名 。 





5.6 本章 小 结 


这 一 章 介绍 了 本 书 的 链接 库 ， 使 读者 在 汇编 语言 应 用 程序 中 更 便于 进行 输入 输出 的 处 理 。 

表 5$-1 列 出 了 Irvine32 链接 库 中 的 绝 大 多 数 过 程 。 本 书 网 站 (www.asmirvine.com) 上 可 
以 获取 所 有 过 程 最 新 更 新 的 列表 。 

5.4.4 节 中 的 库 测试 程序 演示 了 若干 Irvine32 库 的 输入 输出 函数 。 它 生成 并 显示 了 一 组 
随机 数 、 寄 存 器 的 内 容 和 内 存 区 域 的 内 容 。 它 还 显示 了 各 种 格式 的 整数 并 演示 了 字符 串 的 输 
人 输出 。 

运行 时 堆栈 是 一 种 特殊 的 数组 ， 用 于 暂时 保存 地 址 和 数据 。ESP 寄存 器 保存 了 一 个 32 
位 偏 移 量 ， 指 向 栈 中 某 个 位 置 。 由 于 堆栈 中 的 最 后 一 个 数 是 第 一 个 出 栈 的 ， 因 此 ， 堆 栈 被 称 
为 LIFO (后 进 先 出 ) 结构 。 入 栈 操作 将 一 个 数 复制 到 堆栈 。 出 栈 操 作 将 一 个 数 从 堆栈 中 取 
出 并 将 其 复制 到 寄存 器 或 变量 。 堆 栈 通常 存放 过 程 返回 地 址 、 过 程 参 数 、 局 部 变量 和 过 程 内 
使 用 的 寄存 器 。 

PUSH 指令 首先 减少 堆栈 指针 ， 然 后 把 源 操作 数 复制 到 堆栈 中 。POP 指令 首先 把 ESP 指 
向 的 堆栈 内 容 复制 到 目标 操作 数 中 ， 然 后 增加 ESP 的 值 。 

PUSHAD 指令 把 32 位 通用 寄存 器 都 压 人 堆栈 PUSHA 指令 把 16 位 通用 寄存 器 都 压 人 
堆栈 。POPAD 指令 把 堆栈 中 的 数据 弹出 到 32 位 通用 寄存 器 中 ，POPA 指令 把 堆栈 中 的 数据 
弹出 到 16 位 通用 寄存 器 中 。PUSHA 和 POPA 只 能 用 于 16 位 编程 。 
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PUSHFD 指令 将 32 位 EFLAGS 寄存 器 压 人 堆栈 ，POPFD 将 堆栈 数据 弹出 到 EFLAGS 
寄存 器 。PUSHF 和 POPF 对 16 位 FLAGS 寄存 器 进行 同样 的 操作 。 

RevStr 程序 (5.1.2 节 ) 用 堆栈 颠倒 字符 串 顺序 。 

过 程 是 用 PROC 和 ENDP 人 擅 指 令 声明 的 、 已 命名 的 代码 段 ， 用 RET 指令 结束 其 执行 。 
5.2.1 节 中 给 出 的 SumOf 过 程 ， 计 算 了 三 个 整数 之 和 。CALL 指令 通过 将 过 程 地 址 插 人 指令 
指针 寄存 器 来 执行 这 个 过 程 。 当 过 程 执行 结束 时 ，RET (从 过 程 返回 ) 指令 又 将 处 理 器 带 回 
到 程序 中 过 程 被 调用 的 位 置 。 过 程 帜 套 调用 是 指 ， 一 个 被 调用 过 程 在 其 返回 前 又 调用 了 另 一 
个 过 程 。 

带 单个 冒号 的 代码 标号 只 在 包含 它 的 过 程 中 可 见 。 带 : : 的 代码 标号 则 是 全 局 标号 ， 其 


所 在 源 程序 文件 中 的 任何 一 条 语句 都 可 以 访问 它 。 

5.2.5 节 给 出 的 ArraySum 过 程 计 算 并 返回 了 数组 元 素 之 和 。 

与 PROC 伪 指令 一 起 使 用 的 USES 运算 符 ， 列 出 了 过 程 修改 的 全 部 寄存 器 。 汇 编 器 产生 
代码 ， 在 程序 开始 时 将 寄存 器 的 内 容 压 人 堆栈 ， 并 在 过 程 返回 前 弹出 恢复 寄存 器 。 


5.7 关键 术语 


5.7.1 术语 


arguments (参数 ) 

console window (控制 台 窗口 ) 

file handle (文件 句柄 ) 

global label (全 局 标号 ) 

input parameter (输入 参数 ) 

label (标号 ) 

last-in, first-out(LIFO) (后 进 先 出 ) 
link library (链接 库 ) 


5.7.2 指令、 运算 符 和 伪 指 令 


ENDP 
POP 
POPA 
POPAD 
POPFD 
PROC 


5.8 复习 题 和 练习 


5.8.1 简 答 题 


1. 哪 条 指令 将 全 部 的 32 位 通用 寄存 器 压 人 堆栈 ? 
2. 哪 条 指令 将 32 位 EFLAGS 寄存 器 压 人 堆栈 ? 
3. 哪 条 指令 将 堆栈 内 容 弹 出 到 EFLAGS 寄存 器 ? 


nested procedure call ( 肉 套 过 程 调用 ) 
precondition (前 提 ) 

pop operation (出 栈 操作 ) 

push operation (入 栈 操作 ) 

runtime stack (运行 时 堆栈 ) 

stack abstract data type〔 堆 栈 抽象 数据 类 型 ) 
stack data structure (堆栈 数据 结构 ) 

stack pointer register (堆栈 指针 寄存 器 ) 


PUSH 
PUSHA 
PUSHAD 
PUSHFD 
RET 
USES 
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4. 挑战 : 另 一 种 汇编 器 ( 称 为 NASM) 允许 PUSH 指令 列 出 多 个 指定 寄存 器 。 为 什么 这 种 方法 可 能 会 
比 MASM 中 的 PUSHAD 指令 要 好 ? 下 面 是 一 个 NASM 示例 : 


PUSH EAX EBX ECX 


5. 挑战 : 假设 没有 PUSH 指令 ， 另 外 编写 两 条 指令 来 完成 与 push eax 同样 的 操作 。 
6.( 真 / 假 ): RET 指令 将 栈 顶 内 容 弹 出 到 指令 指针 寄存 器 。 
7.( 真 / 假 ): Microsoft 汇编 器 不 允许 过 程 嵌 套 调 用 ， 除 非 在 过 程 定 义 中 使 用 了 NESTED 运算 符 。 
8.( 真 / 假 ): 在 保护 模式 下 ， 每 个 过 程 调用 最 少 使 用 4 个 字 节 的 堆栈 空间 。 
183|] ”9.( 真 / 假 ): 向 过 程 传递 32 位 参数 时 ， 不 能 使 用 ESI 和 EDI 寄存 器 。 
10.( 真 / 假 ); ArraySum 过 程 (5.2.5 节 ) 接收 一 个 指向 任何 一 个 双 字 数组 的 指针 。 
11.( 真 / 假 ): USES 运算 符 能 让 程序 员 列 出 所 有 在 过 程 中 会 被 修改 的 寄存 器 。 
12.( 真 / 假 ): USES 运算 符 只 能 产生 PUSH 指令 ， 因 此 程序 员 必须 自己 编写 代码 完成 POP 指令 功能 。 
13.( 真 / 假 ): 用 USES 伪 指 令 列 出 寄存 器 时 ， 必 须 用 逗号 分 隔 寄存 器 名 。 
14. 修改 ArraySum 过 程 (5.2.5 节 ) 中 的 哪 条 ( 些 ) 语句 ， 使 之 能 计算 16 位 字数 组 的 累积 和 ? 编写 这 
个 版 本 的 ArraySum 并 进行 测试 。 
15. 执行 下 列 指令 后 ，EAX 的 最 后 数值 是 多 少 ? 


Push 5 
push 6 
pop eax 
pop eax 





16. 运行 如 下 示例 代码 时 ， 下 面 哪个 对 执行 情况 的 陈述 是 正确 的 ? 
1: main PROC 

2; push 10 

Be push 20 

4: call Ex2Sub 

SE pop eax 

6: INVOKE ExitProcess,0 

7: main ENDP 

8: 


9: Ex2Sub PROC 
10: pop eax 
11: ret 
12: Ex2Sub ENDP 


a. 到 第 6 行 代码 ，EAX 将 等 于 10 
b. 到 第 10 行 代码 ， 程 序 将 因 运 行 时 错误 而 暂停 
c. 到 第 6 行 代码 ，EAX 将 等 于 20 
d, 到 第 11 行 代码 ， 程 序 将 因 运 行 时 错误 而 暂停 


17. 运行 如 下 示例 代码 时 ， 下 面 哪个 对 执行 情况 的 陈述 是 正确 的 ? 

1: main PROC 

28 mov eax,30 

3: push eax 

4: push 40 

53 call Ex3Sub 

6: INVOKE ExitProcess,0 
7: main ENDP 

8: 

9: Ex3Sub PROC 

10: pusha 

11: mov eax,80 

有 popa 
13: ret 


14: Ex3Sub ENDP 
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a. 到 第 6 行 代 码 ，EAX 将 等 于 40 
b. 到 第 6 行 代码 ， 程 序 将 因 运 行 时 错误 而 暂停 
c. 到 第 6 行 代码 ，EAX 将 等 于 30 
d. 到 第 13 行 代码 ， 程 序 将 因 运 行 时 错误 而 暂停 
18. 运行 如 下 示例 代码 时 ， 下 面 哪个 对 执行 情况 的 陈述 是 正确 的 ? 


1: main PROC 

2 mov eax,40 

3s push offset Here 
ds jmp Ex4Sub 

5s Here: 

6: mov eax,30 

了 8 INVOKE ExitProcess,0 
8: main ENDP 

9: 

10: Ex4Sub PROC 

Tls ret 


12: Ex4Sub ENDP 


a. 到 第 7 行 代码 ，EAX 将 等 于 30 
b. 到 第 4 行 代 码 ， 程 序 将 因 运 行 时 错误 而 暂停 
c. 到 第 6 行 代 码 ，EAX 将 等 于 30 
d. 到 第 11 行 代码 ， 程 序 将 因 运行 时 错误 而 暂停 
19. 运行 如 下 示例 代码 时 ， 下 面 哪个 对 执行 情况 的 陈述 是 正确 的 ? 


1: main PROC 

1 mov edx,0 

3 mov eax,40 
4: push eax 

S's call Ex5Sub 
6 INVOKE ExitProcess,0 
7: main ENDP 

8: 

9: Ex5Sub PROC 

10: pop eax 
1 pop edx 
12; push eax 
133 ret 


14: Ex5Sub ENDP 


a. 到 第 6 行 代码 ，EAX 将 等 于 40 

b. 到 第 13 行 代 码 ， 程 序 将 因 运 行 时 错误 而 暂停 

c. 到 第 6 行 代码 ，EAX 将 等 于 0 

d. 到 第 11 行 代码 ， 程 序 将 因 运 行 时 错误 而 暂停 
20. 执行 下 述 代码 时 ， 哪 些 数值 将 被 写 人 数组 ? 


.data 
array DWORD 4 DUP(0) 
.Code 
main PROC 
mov eax,10 
mov esi,0 
call proc: 1 
add esi,4 
add eax,10 
mov array[lesil],eax 
INVOKE ExitProcess,0 
main ENDP 
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BZOC 1 PROC 
call proc 2 
add esi,4 
add eax,10 
mov array[lesi],eax 
ret 
proc_1 ENDP 


proc 2 PROC 
Call proc 3 
add esi,4 
add eax,10 
mov arraylesil],eax 
ret 
proc 2 ENDP 


Proc 3 PROC 
mov array[lesi],eax 
ret 

proc_3 ENDP 


5.8.2 ”算法 基础 


下 列 习题 可 以 用 32 位 或 64 位 代码 解答 。 

1. 编写 一 组 语句 ， 仅 用 PUSH 和 POP 指令 来 交换 EAX 和 EBX 寄存 器 (或 64 位 的 RAX 和 RBX) 中 
的 值 。 

2. 假设 需要 一 个 子 程序 的 返回 地 址 在 内 存 中 比 当 前 堆栈 中 的 返回 地 址 高 3 个 字 节 。 编 写 一 组 指令 放 在 
该 子 程序 RET 指令 之 前 ， 以 完成 这 个 任务 。 

3. 高 级 语言 的 函数 通常 在 堆栈 中 的 返回 地 址 下 ,立刻 声明 局 部 变量 。 在 汇编 语言 子 程序 开端 编写 一 条 
指令 来 保留 两 个 双 字 变量 的 空间 。 然 后 ， 对 这 两 个 局 部 变量 分 别 赋值 1000h 和 2000h。 

4. 编写 一 组 语句 ， 用 变 址 寻 址 方式 将 双 字 数组 中 的 元 素 复制 到 同一 数组 中 其 前 面 的 一 个 位 置 上 。 

5. 编写 一 组 语句 显示 子 程序 的 返回 地 址 。 注 意 ， 不 论 如 何 修改 堆栈 ， 都 不 能 阻止 子 程序 返回 到 调用 
程序 。 


5.9 ”编程 练习 


为 解答 编程 练习 编写 程序 时 ， 尽 量 使 用 多 个 过 程 。 除 非 读者 的 指导 者 男 有 规定 ， 否 则 遵循 本 书 使 
用 的 风格 和 命名 规则 。 在 每 个 过 程 的 开始 和 非常 规 语句 处 使 用 解释 性 注释 。 
*1. 设置 文本 颜色 
用 循环 结构 ， 编 写 程序 用 四 种 颜色 显示 同一 个 字符 串 。 调 用 本 书 链接 库 的 SetTextColor 过 程 。 
可 以 选择 任何 颜色 ， 但 你 会 发 现 改变 前 景色 是 最 简单 的 。 
** 2. 链接 数组 项 
假设 给 定 的 3 个 数据 项 分 别 代表 一 个 表 、 一 个 字符 数组 以 及 一 个 链接 索引 数组 的 起 始 变 址 。 
编写 程序 遍历 链接 ， 并 按 正确 顺序 定位 字符 。 将 被 定位 的 每 个 字符 都 复制 到 一 个 新 数组 中 。 假 设 使 
用 如 下 示例 数据 ， 且 各 数组 都 从 0 开始 变 址 : 


start = 1 
chars: H A 0 E B D F G 
links: 0 4 S 6 2 3 0 


复制 到 输出 数组 的 数值 (依次 ) 为 A、B、C、D、E、F、G、H。 字 符 数 组 声明 为 BYTE 类 型 ， 
为 了 使 问题 更 加 有 趣 ， 将 链表 数组 声明 为 DWORD 类 型 。 


上 


全 本 


+h, 


妆 宙 6. 


wi 


育 太 8. 


交友 交 9 


好 程 147 





简单 加 法 (1) 

编写 程序 : 清 屏 ， 将 鼠标 定位 到 屏幕 中 心 附 近 ， 提 示 用 户 输入 两 个 整数 ， 两 数 相 加 ， 并 显示 和 数 。 
简单 加 法 ( 2 ) 

以 前 一 题 编 写 的 程序 为 起 点 ， 在 新 程序 中 ， 用 循环 结构 将 上 述 同样 的 步骤 重复 3 次 ,每 次 循 
环 迭 代 后 清 屏 。 
BetterRandomRange 过 程 

Irvine32 链接 库 的 RandomRange 过 程 在 0 一 N-1 范围 内 生成 一 个 伪 随 机 整数 。 本 题 任务 是 编 
写 该 过 程 的 改进 版 ， 在 M ~ N-1 围 内 生成 一 个 整数 。 调 用 程序 用 EBX 传递 M， 用 EAX 传递 N。 
若 将 该 过 程 称 为 BetterRandomRange， 则 下 述 代码 为 测试 示例 : 


mov ebx,-300 ?7 下限 
mov eax,100 ; 上 限 
call BetterRandomRange 


编写 一 个 简短 的 测试 程序 ， 调 用 BetterRandomRange， 并 循环 50 次 。 显 示 每 次 随机 生成 的 数值 。 
随机 字符 串 

创建 过 程 ， 生 成 长 度 为 工 的 随机 字符 串 ， 字 符 全 为 大 写字 母 。 调 用 过 程 时 ， 用 EAX 传递 长 度 
工 的 值 ， 并 传递 一 个 指针 指向 用 于 保存 该 随机 字符 串 的 字 节 数组 。 编 写 测 试 程序 调用 该 过 程 20 次 ， 
并 在 控制 台 窗口 显 示 字 符 串 。 
随机 屏幕 位 置 

编写 程序 在 100 个 随机 屏幕 位 置 显示 一 个 字符 ， 计 时 延迟 为 100 毫秒 。 提 示 : 使 用 GetMaxXY 
过 程 确定 控制 台 窗 口 当 前 大 小 。 
颜色 矩阵 

编写 程序 在 所 有 可 能 的 前 景色 和 背景 色 组 合 ( 16 x 16=256 ) 中 显示 一 个 字符 。 颜 色 编号 从 0 
到 15， 因 此 可 以 用 循环 妊 套 产生 所 有 可 能 的 组 合 。 
递归 过 程 

当 一 个 过 程 调用 其 自身 时 ， 就 称 之 为 直接 递归 。 当 然 ， 编 程 者 不 会 希望 一 个 过 程 一 直 调 用 其 
自身 ， 因 为 运行 时 堆栈 会 占 满 。 相 反 ， 必 须 用 某 些 方法 来 限制 递归 。 编 写 程序 调用 一 个 递归 过 程 。 
在 过 程 中 ， 用 计数 器 加 1 的 方式 确定 其 执行 的 次 数 。 用 调试 器 执行 编写 的 程序 ， 在 程序 结束 时 ， 查 
看 计数 器 的 值 。 向 ECX 输入 一 个 值 来 指定 编程 者 允许 的 连续 递归 次 数 。 只 能 使 用 LOOP 指令 (不 
能 使 用 后 续 章 节 的 其 他 条 件 判断 语句 )， 找 出 方法 使 递归 过 程 按 给 定 次 数 调用 其 自身 。 


*** 10. 斐 波 那 契 生成 器 


编程 一 个 过 程 ， 生 成 含有 N 个 数值 的 斐 波 那 契 ( Fibonacei) 数列 ， 并 将 它们 保存 到 一 个 双 字 
数组 中 。 需 要 输入 的 参数 为 : 双 字数 组 指针 和 生成 数值 个 数 的 计数 器 。 编 写 一 个 测试 程序 来 调用 
该 过 程 ， 使 N=47。 数 组 中 的 第 一 个 值 为 1， 最 后 一 个 值 为 2 971 215 073。 使 用 Visual Studio 调试 
器 打开 并 查看 数组 内 容 。 


***#11. 找 出 K 的 倍数 


现 有 一 字 节 数组 ， 大 小 为 N， 编 写 过程 ， 找 出 所 有 小 于 N 的 KK 的 倍数 。 在 程序 开始 时 ,将 该 
数组 中 所 有 元 素 都 初始 化 为 零 ， 然 后 ， 每 计算 出 一 个 倍数 ， 就 将 数组 中 相应 位 置 1。 过 程 对 其 要 
修改 的 所 有 寄存 器 都 要 进行 保存 和 恢复 。 当 K=2 和 K=3 时 分 别 调用 该 过 程 。 令 N=50， 在 调试 器 
中 运行 程序 并 验证 数组 数值 是 否 正确 。 

注意 : 该 过 程 在 寻找 素数 时 是 一 个 很 有 用 的 工具 。 寻 找 素数 的 一 个 有 效 算 法 被 称 为 厄 拉 多 塞 
过 滤 法 (Sieve of Eratosthenes)。 在 第 6 章 学 习 条 件 判 断 语句 之 后 ， 读 者 就 能 够 实现 这 个 算法 了 。 
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第 6 章 | 


Assembly Language for x86 Processors, Seventh Edition 


条 件 处 理 


本 章 向 程序 员 的 汇编 语言 工具 箱 中 引入 一 个 重要 的 内 容 ， 使 得 编写 出 来 的 程序 具备 作 决 
策 的 功能 。 几 乎 所 有 的 程序 都 需要 这 种 能 力 。 首 先 ， 介 绍 布尔 操作 ， 由 于 能 影响 CPU 状态 
标志 ， 它 们 是 所 有 条 件 指令 的 核心 。 然 后 ， 说明 怎 样 使 用 演绎 CPU 状态 标志 的 条 件 跳 转 和 
循环 指令 。 接 着 演示 如 何 用 本 章 介 绍 的 工具 来 实现 理论 计算 机 科学 中 最 根本 的 结构 之 一 : 有 
限 状态 机 。 本 章 最 后 展示 的 是 MASM 内 置 的 32 位 编程 的 逻辑 结构 。 


6.1 条 件 分 支 


允许 作 决 策 的 编程 语言 使 得 程序 员 可 以 改变 控制 流 ， 使 用 的 技术 被 称 为 条 件 分 支 。 高 级 
语言 中 的 每 一 个 正 语句 、switch 语句 和 条 件 循环 都 内 置 有 分 支 逻 辑 。 汇 编 语 言 ， 虽 然 是 低 
级 语言 ， 但 提供 了 决策 逻辑 所 需 的 所 有 工具 。 本 章 将 了 解 如 何 实现 这 种 从 高 级 条 件 语 句 到 低 
级 实现 代码 的 转化 。 

处 理 硬件 设备 的 程序 必须 要 能 够 控制 数字 的 单个 位 。 每 一 个 位 都 要 被 测试 、 清 除 和 置 
位 。 数 据 加 密 和 压缩 也 要 依靠 位 操作 。 本 章 将 展示 如 何在 汇编 语言 中 实现 这 些 操作 。 

本 章 将 回答 一 些 基 本 问题 : 

e 怎样 使 用 第 1 章 介绍 的 布尔 操作 (AND、OR、NOT) ? 

e 怎样 用 汇编 语言 写 下 语句 ? 

e 编译 器 如 何 将 艇 套 IF 语句 翻译 为 机 器 语言 ? 

e 如 何 清除 和 置 位 二 进 制 数 中 的 单个 位 ? 

e 怎样 实现 简单 的 二 进 制 数据 加 密 ? 

e 在 布尔 表达 式 中 ， 如 何 区 分 有 符号 数 和 无 符号 数 ? 

本 章 遵 循 自 底 而 上 的 方法 ， 以 编程 逻辑 的 二 进 制 基础 为 开端 。 然 后 ， 说 明 CPU 怎样 用 
CMP 指令 和 处 理 器 状态 标志 来 比较 指令 操作 数 。 最 后 ， 将 这 些 内 容 综 合 起 来 ， 展 示 如 何 用 
汇编 语言 实现 高 级 语言 的 逻辑 结构 特征 。 


6.2 布尔 和 比较 指令 


第 1 章 介 绍 了 四 种 基本 的 布尔 代数 操作 : AND、OR、XOR 和 NOT。 用 汇编 语言 指令 ， 
这 些 操作 可 以 在 二 进 制 位 上 实现 。 同 样 ， 这 些 操作 在 布尔 表达 式 层 次 上 也 很 重要 ， 比 如 IF 
语句 。 首 先 了 解 按 位 指令 ， 这 里 使 用 的 技术 也 可 以 用 于 操作 硬件 设备 控制 位 ， 实 现 通 信 协 议 
以 及 加 密 数 据 ， 这 里 只 列举 了 几 种 应 用 。Intel 指令 集 包 含 了 AND 、OR 、XOR 和 NOT 指令 ， 
它们 能 直接 在 二 进 制 位 上 实现 布尔 操作 ， 如 表 6-1 所 示 。 此 外 ，TEST 指令 是 一 种 非 破坏 性 
的 AND 操作 。 
表 6-1 部 分 布尔 指令 
操作 说 明 
AND 源 操作 数 和 目的 操作 数 进行 逻辑 与 操作 
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( 续 ) 
操作 说 明 
OR 源 操作 数 和 目的 操作 数 进行 逻辑 或 操作 
XOR 源 操作 数 和 目的 操作 数 进行 逻辑 异 或 操作 
NOT 对 目标 操作 数 进行 逻辑 非 操作 
TEST 源 操 作 数 和 目的 操作 数 进行 逻辑 与 操作 ， 并 适当 地 设置 CPU 标志 位 


6.2.1 CPU 状态 标志 


布尔 指令 影响 零 标志 位 、 进 位 标志 位 、 符 号 标志 位 、 溢 出 标志 位 和 奇偶 标志 位 。 下 面 简 
单 回顾 一 下 这 些 标志 位 的 含义 : 

e 操作 结果 等 于 0 时 ， 零 标志 位 置 1。 

。 操作 使 得 目标 操作 数 的 最 高 位 有 进位 时 ， 进 位 标志 位 置 1。 

。 符号 标志 位 是 目标 操作 数 高 位 的 副本 ， 如 果 标 志 位 置 1， 表 示 是 负数 ; 标志 位 清 0， 

表示 是 正 数 。( 假 设 0 为 正 。) 
。 指令 产生 的 结果 超出 了 有 符号 目的 操作 数 范围 时 ， 滋 出 标志 位 置 1。 
。 指令 使 得 目标 操作 数 低 字 节 中 有 偶数 个 1 时 ， 奇 偶 标 志 位 置 1。 


6.2.2 AND 指令 


AND 指令 在 两 个 操作 数 的 对 应 位 之 间 进 行 〈 按 位 ) 逻辑 与 (AND ) 操作 ， 并 将 结果 存放 
在 目标 操作 数 中 : 


AND destination, source 


下 列 是 被 允许 的 操作 数组 合 ， 但 是 立即 操作 数 不 能 超过 32 位 : 


RND reg,reg 
AND reg,mem 
AND reg, Imm 
AND mem, reg 
AND mem, imm 


操作 数 可 以 是 8 位 、16 位 、32 位 和 64 位 ,但 是 两 个 操作 数 必须 是 同样 大 小 。 两 个 操作 
数 的 每 一 对 对 应 位 都 遵循 如 下 操作 原则 : 如 果 两 个 位 都 是 1， 则 结果 位 等 于 1 ; 否则 结果 位 
等 于 0。 下 表 是 出 自 第 1 章 的 真 值 表 ， ea 列 是 表达 式 x^y 的 值 : 





AND 指令 可 以 清除 一 个 操作 数 中 的 1 个 位 或 多 个 位 ， 同 时 又 不 影响 其 他 位 。 这 个 技术 
就 称 为 位 屏蔽 ， 就 像 在 粉 剧 房 子 时 ， 用 这 盖 胶 带 把 不 用 粉刷 的 地 方 (如 窗户 ) 盖 起 来 。 例 如 ， 
假设 要 将 一 个 控制 字 节 从 AL 寄存 器 复制 到 硬件 设备 。 并 且 当 控 制 字 节 的 位 0 和 位 3 等 于 0 
时 ， 该 设备 复位 。 那 么 ， 如 果 想 要 在 不 修改 AL 其 他 位 的 条 件 下 ， 复 位 设备 ， 可 以 用 下 面 的 
指令 : 


and AL,11110110b ; 清除 位 0 和 位 3， 其 他 位 不 变 
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如 ， 设 AL 初始 化 为 二 进 制 数 1010 1110, 将 其 与 1111 0110 进行 AND 操作 后 ，AL 等 
于 1010 0110: 


mov al,10101110b 
and al,11110110b 


?AL 中 的 结果 =1010 0110 
标志 位 ”AND 指令 总 是 清除 溢出 和 进位 标志 位 ， 并 根据 目标 操作 数 的 值 来 修改 符号 标 


志 位 、 零 标志 位 和 奇偶 标志 位 。 比 如 ， 下 面 指令 的 结果 存放 在 EAX 寄存 器 ， 假 设 其 值 为 0。 
在 这 种 情况 下 ， 和 零 标 志 位 就 会 置 1 : 


and eax,1Fh 
将 字符 转换 为 大 写 


AND 指令 提供 了 一 种 简单 的 方法 将 字符 从 小 写 转换 为 大 写 。 如 果 对 比 大 写 A 和 小 写 a 
的 ASCII 码 ， 就 会 发 现 只 有 位 5 不同: 

0 

O00 


其 他 的 字母 字符 也 是 同样 的 关系 。 把 任何 一 个 字符 与 二 进 制 数 1101 1111 进行 AND， 
则 除 位 5 外 的 所 有 位 都 保持 不 变 ， 而 位 5 清 0。 下 例 中 ， 数 组 中 所 有 字符 都 转换 为 大 写 : 


.data 

array BYTE 50 DUP(?) 

.Code 
mov ecx, LENGTHOF array 
mov esi,OFFSET array 


Ll: and BYTE PTR [esil,11011111b ; 清除 位 5 
inc esi 


loop Ll1 


6.2.3 OR 指令 


OR 指令 在 两 个 操作 数 的 对 应 位 之 间 进 行 ( 按 位 ) 逻辑 或 ( OR) 操作 ， 并 将 结果 存放 在 
目标 操作 数 中 : 


OR destination,source 


OR 指令 操作 数组 合 与 AND 指令 相同 : 


OR reg,reg 
OR reg,mem 
OR reg,imm 
OR mem,reg 
OR mem, imm 


操作 数 可 以 是 8 位 、16 位 、32 位 和 64 位 ， 但 是 两 个 操作 数 必须 是 同样 大 小 。 对 两 个 操 


作 数 的 每 一 对 对 应 位 而 言 ， 只 要 有 一 个 输入 位 是 1， 则 输出 位 就 是 1。 下 面 的 真 值 表 (出自 
第 1 章 ) 展示 了 布尔 运算 xvy: 
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当 需 要 在 不 影响 其 他 位 的 情况 下 ， 将 操作 数 中 的 1 个 位 或 多 个 位 置 为 1 时 ，OR 指令 就 非 
常 有 用 了 。 比 如 ， 计 算 机 与 伺服 电机 相连 ， 通 过 将 控制 字 节 的 位 2 置 1 来 启动 电机 。 假 设 该 控 
制 字 节 存 放 在 AL 寄存 器 中 ， 每 一 个 位 都 含有 重要 信息 ,那么 ， 下 面 的 指令 就 只 设置 了 位 2: 


or AL,00000100b ;位 2 置 1， 其 他 位 不 变 


如 果 AL 初始 化 为 二 进 制 数 1110 0011， 把 它 与 0000 0100 进行 OR 操作 ， 其 结果 等 于 
1110 0111: 


mov al,11100011b 
or al,00000100b ;AL 中 的 结果 =1110 0111 


标志 位 ”OR 指令 总 是 清除 进位 和 溢出 标志 位 ， 并 根据 目标 操作 数 的 值 来 修改 符号 标志 


位 、 零 标志 位 和 奇偶 标志 位 。 比 如 ， 可 以 将 一 个 数 与 它 自身 (或 0 ) 进行 OR 运算 ， 来 获取 
该 数值 的 某 些 信息 : 


GE alial 


下 表 给 出 了 零 标 志 位 和 符号 标志 位 对 AL 内 容 的 说 明 : 





6.2.4 位 映射 集 


有 些 应 用 控制 的 对 象 是 从 一 个 有 限 全 集中 选 出 来 的 一 组 项 目 。 就 像 公司 里 的 雇员 ， 或 者 
气象 监测 站 的 环境 读数 。 在 这 些 情景 中 ， 二 进 制 位 可 以 代表 集合 成 员 。 与 Java HashSet 用 指 
针 或 引用 指向 容器 内 对 象 不 同 ， 应 用 可 以 用 位 向 量 (或 位 映射 ) 把 一 个 二 进 制 数 中 的 位 映射 
为 数组 中 的 对 象 。 

如 下 例 所 示 ， 二 进 制 数 的 位 从 左边 0 号 开始 ， 到 右边 31 号 为 止 ， 该 数 表示 了 数组 元 素 
0、1、2 和 31 是 名 为 SetX 的 集合 成 员 : 

SetX = 10000000 00000000 00000000 00000111 

(为 了 提供 可 读 性 ， 字 节 已 经 分 开 。) 通过 在 特定 位 置 与 1 进行 AND 运算 ,就 可 以 方便 
地 检测 出 该 位 是 否 为 集合 成 员 : 

mov eax,Setx 

and eax,10000b ; 元 素 [4] 是 Setx 的 成 员 吗 ? 

如 果 本 例 中 的 AND 指令 清除 了 零 标志 位 ， 那 么 就 可 以 知道 元 素 [4] 是 SetX 的 成 员 。 

1. 补 集 

补 集 可 以 用 NOT 指令 生成 ，NOT 指令 将 所 有 位 都 取 反 。 因 此 ， 可 以 用 下 面 的 指令 生成 
上 例 中 SetX 的 补 集 ， 并 存放 在 EAX 中 : 


mov eax, SetX 
not eax ;SetX 的 补 集 


2. 交集 
AND 指令 可 以 生成 位 向 量 来 表示 两 个 集合 的 交集 。 下 面 的 代码 生成 集合 SetX 和 SetY 
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的 交集 ， 并 将 其 存放 在 EAX 中 : 


mov eax,Setx 
and eax, SetY 


SetX 和 SetY 交集 生成 过 程 如 下 所 示 : 


1000000000000000000000000000111 (Setx) 
AND 1000001010100000000011101100011 (SetY) 


1000000000000000000000000000011 ( 交集 ) 


很 难 想象 还 有 更 快捷 的 方法 生成 交集 。 对 于 更 大 的 集合 来 说 ， 它 所 需要 的 位 超过 了 单个 
寄存 器 的 容量 ， 因 此 ， 需 要 用 循环 来 实现 所 有 位 的 AND 运算 。 

3. 并 集 

OR 指令 生成 位 图 表示 两 个 集合 的 并 集 。 下 面 的 代码 产生 集合 SetX 和 SetY 的 并 集 ， 并 
将 其 存放 在 EAX 中 : 


mov eax,Setx 
or eax, SetY 


OR 指令 生成 SetX 和 SetY 并 集 的 过 程 如 下 所 示 : 


1000000000000000000000000000111 (SetX) 
OR 1000001010100000000011101100011 (SetY) 
1000001010100000000011101100111 (并 集 ) 


6.2.5 XOR 指令 


XOR 指令 在 两 个 操作 数 的 对 应 位 之 间 进行 ( 按 位 ) 逻辑 异 或 (XOR) 操作 ， 并 将 结果 存 
放 在 目标 操作 数 中 : 


XOR destination,source 


XOR 指令 操作 数组 合 和 大 小 与 AND 指令 及 OR 指令 相同 。 两 个 操作 数 的 每 一 对 对 应 位 
都 应 用 如 下 操作 原则 : 如 果 两 个 位 的 值 相同 ( 同 为 0 或 同 为 1 )， 则 结果 位 等 于 0 ; 否则 结果 
位 等 于 1。 下 表 描 述 的 是 布尔 运算 x 四 y: 





与 0 异 或 值 保 持 不 变 ， 与 1 异 或 则 被 触发 ( 求 补 )。 对 相同 操作 数 进行 两 次 XOR 运算 ， 
则 结果 首 转 为 其 本 身 。 如 下 表 所 示 , 位 x y oT 结果 逆转 为 x 的 初始 值 : 
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在 6.3.4 节 中 会 发 现 ， 异 或 运算 这 种 “可 逆 的 ”属性 使 其 成 为 简单 对 称 加 密 的 理想 工具 。 

标志 位 XOR 指令 总 是 清除 溢出 和 进位 标志 位 ， 并 根据 目标 操作 数 的 值 来 修改 符号 标 
志 位 、 零 标志 位 和 奇偶 标志 位 。 

检查 奇偶 标志 ”奇偶 检查 是 在 一 个 二 进 制 数 上 实现 的 功能 ， 计 算 该 数 中 1 的 个 数 ; 如 果 
计算 结果 为 偶数 ， 则 说 该 数 是 偶 校 验 ; 如 果 结 果 为 奇数 ， 则 该 数 为 奇 校 验 。x86 处 理 器 中 ， 
当 按 位 操作 或 算术 操作 的 目标 操作 数 最 低 字 节 为 偶 校 验 时 ， 奇 偶 标 志 位 置 1。 反 之 ， 如 果 操 
作 数 为 奇 校 验 ， 则 奇偶 标志 位 清 0。 一 个 既 能 检查 数 的 奇偶 性 ， 又 不 会 修改 其 数值 的 有 效 方 
法 是 ， 将 该 数 与 0 进行 异 或 运算 : 


mov al,10110101b ;5 个 1， 奇 校 验 


xor al,0 ; 奇偶 标志 位 清 0( 奇 ) 
mov al,11001100b ;4 个 1， 偶 校 验 
xor al,0 ; 奇偶 标志 位 置 1( 偶 ) 


Visual Studio 用 PE=1 表示 偶 校 验 ，PE=0 表示 奇 校 验 。 

16 位 奇偶 性 对 16 位 整数 来 说 ， 可 以 通过 将 其 高 字 节 和 低 字 节 进 行 异 或 运算 来 检测 数 
的 奇偶 性 : 

mov ax,64C1lh ; 0110 0100 1100 0001 

xor ah,al ; 奇偶 标志 位 置 1( 偶 ) 

将 每 个 寄存 器 中 的 置 1 位 (等 于 1 的 位 ) 想象 为 一 个 8 位 集合 中 的 成 员 。XOR 指令 把 两 
个 集合 交集 中 的 成 员 清 0， 并 形成 了 其 余 位 的 并 集 。 这 个 并 集 的 奇偶 性 与 整个 16 位 整数 的 
奇偶 性 相同 。 

那么 32 位 数值 呢 ? 如 果 将 数值 的 字 节 进行 编号 ， 从 Bo 到 B3， 那么 计算 奇偶 性 的 表达 
式 为 : B。 XOR B, XOR B, XOR B:。 


6.2.6 NOT 指令 


NOT 指令 触发 (翻转 ) 操作 数 中 的 所 有 位 。 其 结果 被 称 为 反 码 。 该 指令 允许 的 操作 数 类 
型 如 下 所 示 : 

NOT reg 

NOT mem 

例如 ，F0h 的 反 码 是 0Fh: 


mov al,11110000b 
not al ; AL = 00001111b 


标志 位 NOT 指令 不 影响 标志 位 。 
6.2.7 TEST 指令 


TEST 指令 在 两 个 操作 数 的 对 应 位 之 间 进 行 AND 操作 ， 并 根据 运算 结果 设置 符号 标志 
位 、 零 标志 位 和 奇偶 标志 位 。TEST 指令 与 AND 指令 唯一 不 同 的 地 方 是 ，TEST 指令 不 修改 
目标 操作 数 。TEST 指令 允许 的 操作 数组 合 与 AND 指令 相同 。 在 发 现 操作 数 中 单个 位 是 否 
置 位 时 ，TEST 指令 非常 有 用 。 

示例 : 多 位 测试 TEST 指令 同时 能 够 检查 几 个 位 。 假 设想 要 知道 AL 寄存 器 的 位 0 和 
位 3 是 否 置 1， 可 以 使 用 如 下 指令 : 


154 和 锚 6 茧 


test al,00001001b ; 测试 位 0 和 位 3 


(本 例 中 的 0000 1001 称 为 位 掩 码 。) 从 下 面 的 数据 集 例子 中 ， 可 以 推断 只 有 当 所 有 测试 
位 都 清 0 时 ， 零 标志 位 才 置 1: 


00100101 <- 输 入 值 
0001001 <- 测试 值 
00000001 <- 结 果 : ZF=0 
00100100 <- 输 入 值 
000014001 <- 测试 值 
00000000 <- 结果 : ZF=1 


标志 位 TEST 指令 总 是 清除 溢出 和 进位 标志 位 ， 其 修改 符号 标志 位 、 零 标志 位 和 奇偶 
标志 位 的 方法 与 AND 指令 相同 。 


6.2.8 ”CMP 指令 


了 解 了 所 有 按 位 操作 指令 后 ， 现 在 来 讨论 逻辑 (布尔 ) 表达 式 中 的 指令 。 最 常见 的 布尔 
表达 式 涉 及 一 些 比较 操作 ， 下 面 的 伪 码 片段 展示 了 这 种 情况 : 

pr 

while X > 0 and Xx < 200 

IE check_for error({ N ) = true 

x86 汇编 语言 用 CMP 指令 比较 整数 。 字 符 代码 也 是 整数 ， 因 此 可 以 用 CMP 指令 。 浮 点 
数 需要 特殊 的 比较 指令 ， 相 关内 容 将 在 第 12 章 介绍 。 

CMP (比较 ) 指令 执行 从 目的 操作 数 中 减 去 源 操作 数 的 隐 含 减法 操作 ， 并 且 不 修改 任何 
操作 数 : 

CMP destination, source 

标志 位 ” 当 实际 的 减法 发 生 时 ，CMP 指令 按照 计算 
结果 修改 溢出 、 符 号 、 零 、 进 位 、 辅 助 进位 和 奇偶 标志 
位 。 如 果 比 较 的 是 两 个 无 符号 数 ， 则 零 标志 位 和 进位 标 
志 位 表示 的 两 个 操作 数 之 间 的 关系 如 右 表 所 示 ， 

如 果 比 较 的 是 两 个 有 符号 数 ， 则 符号 标志 位 、 零 标 
志 位 和 溢出 标志 位 表示 的 两 个 操作 数 之 间 的 关系 如 右 表 目的 操作 数 < 源 操作 数 
所 示 : 目的 操作 数 > 源 操作 数 

CMP 指令 是 创建 条 件 逻 辑 结构 的 重要 工具 。 当 在 条 。 -目的 操作 数 一 源 操 作 数 
件 跳 转 指令 中 使 用 CMP 时 ， 汇 编 语 言 的 执行 结果 就 和 IF 语句 一 样 。 

示例 ”下面 用 三 段 代码 来 说 明 标 志 位 是 如 何 受到 CMP 影响 的 。 设 AX=5， 并 与 10 进行 
比较 ， 则 进位 标志 位 将 置 1， 原 因 是 ( 5-10 ) 需要 借 位 : 

se + ZF= 0 and CcF=1 

1000 与 1000 比较 会 将 零 标志 位 置 1， 因 为 目标 操作 数 减 去 源 操作 数 等 于 0: 


mov ax,1000 
mov cx,1000 
cmp cx,ax ;ZF=1 andcF=0 


105 与 0 进行 比较 会 清除 零 和 进位 标志 位 ， 因 为 ( 105-0 ) 的 结果 是 一 个 非 零 的 正 整数 。 
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mov si,105 
cmp si,0 ;ZFP=0 andCcF=0 


6.2.9 ” 置 位 和 清除 单个 CPU 标志 位 


怎样 能 方便 地 置 位 和 清除 零 标志 位 、 符 号 标志 位 、 进 位 标志 位 和 溢出 标志 位 ? 有 几 种 
方法 ， 其 中 的 一 些 需 要 修改 目标 操作 数 。 要 将 零 标志 位 置 1， 就 把 操作 数 与 0 进行 TEST 或 
AND 操作 ; 要 将 零 标志 位 清 零 ， 就 把 操作 数 与 1 进行 OR 操作 : 


test al1,0 ; 零 标志 位 置 1 
and al,0 7 零 标 志 位 置 1 
or al,l ;? 零 标志 位 清 零 


TEST 指令 不 修改 目的 操作 数 ， 而 AND 指令 则 会 修改 目的 操作 数 。 若 要 符号 标志 位 置 
1， 将 操作 数 的 最 高 位 和 1 进行 OR 操作 ; 若 要 清除 符号 标志 位 ， 则 将 操作 数 最 高 位 和 0 进 
行 AND 操作 : 


or al,80h ; 符号 标志 位 置 1 
and al,7Fh ; 符号 标志 位 清 零 
车 要 进位 标志 位 置 1， 用 STC 指令 ; 清除 进位 标志 位 ， 用 CLC 指令 : 
stc ; 进位 标志 位 置 1 
clc ; 进位 标志 位 清 零 


若 要 溢出 标志 位 置 1， 就 把 两 个 正 数 相 加 使 之 产生 负 的 和 数 ; 若 要 清除 溢出 标志 位 ， 则 
将 操作 数 和 0 进行 OR 操作 : 


mov al,7Fh AL = +127 
inc al ; AL = 80h (-128), OF=1 
or eax,0 ;? 洲 出 标志 位 清 零 


6.2.10 ”64 位 模式 下 的 布尔 指令 


大 多 数 情况 下 ，64 位 模式 中 的 64 位 指令 与 32 位 模式 中 的 操作 是 一 样 的 。 比 如 ， 如 果 
源 操作 数 是 常数 ， 长 度 小 于 32 位 ， 而 目的 操作 数 是 一 个 64 位 寄存 器 或 内 存 操作 数 ， 那 么 ， 
目的 操作 数 中 所 有 的 位 都 会 受到 影响 : 


.data 


allones QWORD OFFFFFFFFFFFFFFFFh 

.Code 
mov rax,allones ; RAX = FFFFFFFFFFFFFFFF 
and rax,80h ; RAX = 0000000000000080 
mov rax,allones ; RAX = FFFFFFFFFFFFFFFF 
and rax,8080h ; RAX = 0000000000008080 
mov rax,allones ; RAX = FFFFFFFFFFFFFFFF 
and rax,808080h ; RAX = 0000000000808080 


但 是 ， 如 果 源 操作 数 是 32 位 常数 或 寄存 器 ， 那么 目的 操作 数 中 ， 只 有 低 32 位 会 受到 影 
响 。 如 下 例 所 示 ， 只 有 RAX 的 低 32 位 被 修改 了 : 

mov rax,allones ; RAX = FFFFFFFFFFFFFFFF 

and rax,80808080h ; RAX = FFFFFFFF80808080 

当 目 的 操作 数 是 内 存 操作 数 时 ， 得 到 的 结果 是 一 样 的。 显然 ，32 位 操作 数 是 一 个 特殊 
的 情况 ， 需 要 与 其 他 大 小 操作 数 的 情况 分 开 考 虑 。 
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6.2.11 本 节 回 顾 


1. 编写 一 条 指令 ， 用 16 位 操作 数 清 除 AX 的 高 8 位， 而 AX 的 低 8 位 不 变 。 

2. 编写 一 条 指令 ， 用 16 位 操作 数 使 AX 的 高 8 位置 1， 而 AX 的 低 8 位 不 变 。 

3. 编写 一 条 指令 (不 使 用 NOT), 使 EAX 中 所 有 位 取 反 。 

4. 编写 指令 实现 如 下 功能 ， 当 EAX 的 32 位 值 为 偶数 时 ,将 零 标 志 位 置 1 ; 当 EAX 的 值 为 
奇数 时 ， 将 零 标 志 位 清 零 。 

5. 编写 一 条 指令 ， 将 AL 中 的 大 写字 母 转 换 为 小 写字 母 ; 如 果 AL 中 已 包含 小 写字 母 ， 则 不 
修改 AL。 


6.3 条 件 跳 转 


6.3.1 条 件 结构 


x86 指令 集中 没有 明确 的 高 级 逻辑 结构 ， 但 是 可 以 通过 比较 和 跳 转 的 组 合 来 实现 它们 。 
执行 一 个 条 件 语 句 需要 两 个 步骤 : 第 一 步 , 用 CMP、AND 或 SUB 操作 来 修改 CPU 状态 标志 
位 ; 第 二 步 ， 用 条 件 跳 转 指令 来 测试 标志 位 ， 并 产生 一 个 到 新 地 址 的 分 支 。 下 面 是 一 些 例子 。 

示例 1 本 例 中 的 CMP 指令 把 EAX 的 值 与 0 进行 比较 ， 如 果 该 指令 将 零 标志 位 置 1， 
则 JZ (为 零 跳 转 ) 指令 就 跳 转 到 标号 L1: 


cmp eax,0 
jz EL ; 如 果 ZF=1 则 跳 转 


Li 
示例 2 本 例 中 的 AND 指令 对 DL 寄存 器 进行 按 位 与 操作 ， 并 影响 零 标志 位 。 如 果 零 
标志 位 清 零 ， 则 JNZ ( 非 零 跳 转 ) 指令 跳 转 : 


and dl,10110000b 
jnz 12 ; 如 果 ZF=0 则 跳 转 


L2: 


6.3.2 ”Jcond 指令 


当 状 态 标 志 条 件 为 真 时 ， 条 件 跳 转 指令 就 分 支 到 目标 标号 。 否 则 ， 当 标志 位 条 件 为 假 
时 ， 立 即 执行 条 件 跳 转 后 面 的 指令 。 语 法 如 下 所 示 : 


Jcond destination 


cond 是 指 确定 一 个 或 多 个 标志 位 状态 的 标志 位 条 件 。 下 面 是 基于 进位 和 零 标志 位 的 例子 : 
进位 跳 转 (进位 标志 位 置 1 ) 
无 进位 跳 转 (进位 标志 位 清 零 ) 
为 零 跳 转 ( 零 标志 位 置 1 ) 
非 零 跳 转 ( 零 标 志 位 清 零 ) 

CPU 状态 标志 位 最 常见 的 设置 方法 是 通过 算术 运算 、 比 较 和 布尔 运算 指令 。 条 件 跳 转 
指令 评估 标志 位 状态 ， 利 用 它们 来 决定 是 否 发 生 跳 转 。 









JNC 
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用 CMP 指令 假设 当 EAX=5 时 ， 跳 转 到 标号 L1。 在 下 面 的 例子 中 ， 如 果 EAX=5， 
CMP 指令 就 将 零 标 志 位 置 1; 之 后 ， 由 于 零 标志 位 为 1， 有 下 指令 就 跳 转 到 L1 : 


cmp eax 
1 


“5 
je Ll ;如果 相 等 则 跳 转 


(JE 指令 总 是 按照 零 标 志 位 的 值 进行 跳 转 。) 如 果 EAX 不 等 于 5，CMP 就 会 清除 零 标 志 
位 ， 那么 ，JE 指令 将 不 跳 转 。 200 
下 例 中 ， 由 于 AX 小 于 6， 所 以 开 指令 跳 转 到 标号 L1: 


mov ax,5 

cmp ax,6 

jl ”Ll1 ;小 于 则 跳 转 

下 例 中 ， 由 于 AX 大 于 4， 所 以 发 生 跳 转 : 


mov ax,5 
cmp 


ax,4 
jg Ll ;大 于 则 跳 转 


6.3.3 条件 跳 转 指令 类 型 


x86 指令 集 包 含 大 量 的 条 件 跳 转 指令 。 它 们 能 比较 有 符号 和 无 符号 整数 ， 并 根据 单个 
CPU 标志 位 的 值 来 执行 操作 。 条 件 跳 转 指令 可 以 分 为 四 个 类 型 : 

e 基于 特定 标志 位 的 值 跳 转 

e 基于 两 数 是 否 相 等 ， 或 是 否 等 于 (E) CX 的 值 跳 转 

e 基于 无 符号 操作 数 的 比较 跳 转 

e。 基于 有 符号 操作 数 的 比较 跳 转 

表 6-2 展示 了 基于 零 标志 位 、 进 位 标志 位 、 滋 出 标志 位 、 奇 偶 标 志 位 和 符号 标志 位 的 
跳 转 。 

表 6-2 ”基于 特定 标志 位 值 的 跳 转 

[item | cr | ms | mem | 
| | ceo | | 人 KGM 转 | 
| 溢 H 中 转 | of- | mp | 奇人 验 员 转 | 

1. 相等 性 的 比较 

表 6-3 列 出 了 基于 相等 性 评估 的 跳 转 指令 。 有 些 情况 下 ， 进 行 比较 的 是 两 个 操作 数 ; 其 
他 情况 下 ， 则 是 基于 CX、ECX 或 RCX 的 值 进行 跳 转 。 表 中 符号 leftOp 和 rightOp 分 别 指 
的 是 CMP 指令 中 的 左 (目的 ) 操作 数 和 右 ( 源 ) 操 表 6-3 ”基于 相等 性 的 跳 转 
作 数 : 
















助 记 符 标志 位 / 寄存 器 





CMP leftOp,rightop 相等 跳 转 (lefOp=rightOp ) 
不 相等 跳 转 (leftOp 关 rightOp) 


操作 数 名 字 反 映 了 代数 中 关系 运算 符 的 操作 数 
顺序 。 比 如 ， 表 达 式 X 二 Y 中 , X 被 称 为 leftOp， 
Y 被 称 为 rightOp。 RCX=0 跳 转 ( 64 位 模式 ) [0l 
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尽管 正 指 令 相 当 于 JZ (为 零 跳 转 )，JNE 指令 相当 于 JNZ ( 非 零 跳 转 )， 但 是 ， 最 好 是 
选择 最 能 表明 编程 意图 的 助 记 符 (下 或 也)， 以 便 说 明 是 比较 两 个 操作 数 还 是 检查 特定 的 状 

下 述 示 例 使 用 了 JE、JNE、JCXZ 和 JECXZ 指令 。 人 和 仔细 阅读 注释 ， 以 保证 理解 为 什么 
条 件 跳 转 得 以 实现 (或 不 实现 )。 

示例 1: 


mov edx, 0A523h 
cmp edx, 0A523h 
jne L5 ; 不 发 生 跳 转 
je 1L1 ; 跳 转 


示例 2: 


mov bx,1234h 
sub bx,1234h 
jne L5 ;不 发 生 跳 转 


je Ll 7 跳 转 
示例 3: 

mov Cx, OFFFFh 
inc cx 

jcxz 1L2 ; 跳 转 
示例 4: 

XO ecx,ecx 
jecxz L2 ; 跳 转 
2. 无 符号 数 比 较 


基于 无 符号 数 比 较 的 跳 转 如 表 6-4 所 示 。 操 作 数 的 名 称 反映 了 表达 式 中 操作 数 的 顺序 
(比如 leftOp < rightOp)。 表 6-4 中 的 跳 转 仅 在 比较 无 符号 数值 时 才 有 意义 。 有 符号 操作 数 
使 用 不 同 的 跳 转 指令 。 


表 6-4 ”基于 无 符号 数 比较 的 跳 转 
说 明 


大 于 跳 转 ( 若 leftOp > rightOp) 小 于 跳 转 ( 若 leftOp 一 rightOp) 


不 小 于 或 等 于 跳 转 (与 JA 相同 ) 不 大 于 或 等 于 跳 转 (与 JB 相同 ) 


大 于 或 等 于 跳 转 ( 若 leftOp > rightOp) 小 于 或 等 于 跳 转 ( 若 lefOp < rightOp) 
| 不 小 于 中 转 (与 JAE 相同 ) |】 INA | 不 大 于 号 转 (与 JBE 相同 ) 
3. 有 符号 数 比较 
表 6-5 列 出 了 基于 有 符号 数 比较 的 跳 转 。 下 面 的 指令 序列 展示 了 两 个 有 符号 数值 的 
比较 : 





mov al,+127 ; 十 六 进 制 数值 7Fh 
cmp al,-128 ; 十 六 进 制 数值 80h 
ja IsAbove ; 不 跳 转 ， 因 为 7Fh < 80h 
jg IsGreater ; 跳 转 ， 因 为 +127 > -128 


由 于 无 符号 数 7Fh 小 于 无 符号 数 80h， 因 此 ， 为 无 符号 数 比较 而 设计 的 JA 指令 不 发 
生 跳 转 。 另 一 方面 ， 由 于 +127 大 于 -128， 因 此 ， 为 有 符号 数 比 较 而 设计 的 JG 指令 发 生 
跳 转 。 
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表 6-5 基于 有 符号 数 比 较 的 跳 转 


大 于 跳 转 ( 若 leftOp > rightOp) 
不 小 于 或 等 于 跳 转 (与 JG 相同 ) i 不 大 于 或 等 于 跳 转 《与 蕊 相同) 





大 于 或 等 于 跳 转 ( 若 lefOp > rightOop) | JLE | 
JNG 


对 下 面 的 代码 示例 ， 阅 读 注释 ， 以 保证 理解 为 什么 跳 转 得 以 实现 (或 不 实现 ): 
示例 1 


mov edx,-1 

cmp edx,0 

jnl L5 ; 不 发 生 跳 转 (-1 过 0 为 假 ) 
jnle L5 ; 不 发 生 跳 转 (一 1 > 0 为 假 ) 
jl L1 ; 跳 转 (-1 < 0 为 真 ) 


jng L5 ; 不 发 生 跳 转 (+32 入 -35 为 假 ) 
jnge L5 ; 不 发 生 跳 转 (+32 < -35 为 假 ) 


jge 11 ; 跳 转 (+32 过 -35 为 真 ) 
示例 3 

mov ecx,0 

cmp ecx,0 

jg L5 ; 不 发 生 跳 转 (0 > 0 为 假 ) 
jnl L1 ; 跳 转 (0 宇 0 为 真 ) 
示例 4 

mov ecx,0 

cmp ecx,0 

j1 L5 ; 不 发 生 跳 转 (0 < 0 为 假 ) 
jng L1 ; 跳 转 (0 过 0 为 真 ) 


6.3.4 条件 跳 转 应 用 


测试 状态 位 ”汇编 语言 做 得 最 好 的 事情 之 一 就 是 位 测试 。 通 常 ， 不 希望 改变 进行 位 测试 
的 数值 ， 但 是 却 希 望 能 修改 CPU 状态 标志 位 的 值 。 条 件 跳 转 指令 常常 用 这 些 状态 标志 位 来 
决定 是 否 将 控制 转向 代码 标号 。 例 如 ， 假 设 有 一 个 名 为 status 的 8 位 内 存 操作 数 ， 它 包含 了 
与 计算 机 连接 的 一 个 外 设 的 状态 信息 。 如 果 该 操作 数 的 位 5 等 于 1， 表示 外 设 离线 ， 则 下 面 
的 指令 就 跳 转 到 标号 : 


mov al,status 
test al,00100000b ; 测试 位 5 
jnz DeviceOffline 


如 果 位 0、1 或 4 中 任 一 位 置 1， 则 下 面 的 语句 跳 转 到 标号 : 


mov al,status 
test al,00010011b ; 测试 位 0、1、4 
jnz InputDataByte 


如 果 是 位 2、3 和 7 都 置 1 使 得 跳 转 发 生 ， 则 还 需要 AND 和 CMP 指令 : 
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mov al, status 

and ”al,10001100b ; 屏蔽 位 2、3 和 7 
cmp al,10001100b ; 所 有 位 都 置 1? 
je ResetMachine ; 是 : 跳 转 


两 个 数 中 的 较 大 数 下 面 的 代码 比较 了 EAX 和 EBX 中 的 两 个 无 符号 整数 ， 并 且 把 其 中 


较 大 的 数 送 入 EDX: 
mov edx,eax ; 假设 EAX 存放 较 大 的 数 
cmp eax,ebx ; 车 EAX 之 EBX 
jae 1L1 ; 跳 转 到 工 1 
mov edx,ebx ; 和 否则， 将 EBX 的 值 送 入 EDX 
L1: ;EDX 中 存放 的 是 较 大 的 数 


三 个 数 中 的 最 小 数 ”下面 的 代码 比较 了 分 别 存放 于 三 个 变量 V1、V2 和 V3 的 无 符号 16 
位 数值 ， 并 且 把 其 中 最 小 的 数 送 入 AX: 


.data 
V1 WORD ? 
V2 WORD ? 
V3 WORD ? 
.Code 
mov ax,Vi ; 假设 V1 是 最 小 值 
cmp ax,V2 ; 如 果 AX 委 V2 
jbe 11 ; 跳 转 到 L1 
mov ax,V2 ; 否则 ,将 V2 送 入 AX 
L1: cmp ax,V3 ; 如 果 AX 壹 V3 
jbe 1L2 ; 跳 转 到 L2 
mov ax,V3 ; 否则 ,将 V3 送 入 AX 
L2: 


循环 直到 按 下 按键 ”下面 的 32 位 代码 会 持续 循环 ， 直 到 用 户 按 下 任意 一 个 标准 的 字母 
数字 键 。 如 果 输 入 缓冲 区 中 当前 没有 按键 ， 那 么 Irvine32 库 中 的 ReadKey 函数 就 会 将 零 标 


志 位 置 1: 

.data 

char BYTE ? 

.Code 

L1: mov eax,10 ; 创建 10 毫秒 的 延迟 
call Delay ; 检查 按键 
call ReadKey ; 如 果 没 有 按键 则 循环 
二 L1 字 
mov char,AL i 


上 述 代 码 在 循环 中 插入 了 一 个 10 毫秒 的 延迟 ， 以 便 MS-Windows 有 时 间 处 理事 件 消 


息 。 如 果 省 略 这 个 延迟 ， 那 么 按键 可 能 被 忽略 。 
1. 应 用 : 顺序 搜索 数组 


常见 的 编程 任务 是 在 数组 中 搜索 满足 某 些 条 件 的 数值 。 例 如 ， 下 述 程序 就 是 在 一 个 16 
位 数组 中 寻找 第 一 个 非 零 数值 。 如 果 找 到 ， 则 显示 该 数值 ; 否则 ， 就 显示 一 条 信息 ， 以 说 明 


没有 发 现 非 零 数值 : 


; 扫描 数组 (ArrayScan.asm) 
; 扫描 数组 寻找 第 一 个 非 零 数值 

INCLUDE Irvine32.inc 

.data 

intArray SWORD 0,0,0,0,1,20,35,-12,66,4,0 
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iintArray SWORD 


1,0,0,0 ;候补 测试 数据 
;intArray SWORD 0,0,0,0 ; 候补 测试 数据 
;intArray SWORD 0,0.,0,1 ;i 修补 测试 数据 
noneMsg BYTE "A non-zero value was not found",0 


本 程序 包含 了 可 以 替换 的 测试 数据 ， 它 们 已 经 被 注释 出 来 。 取 消 这 些 注 释 行 ， 就 可 





以 用 不 同 的 数据 配置 来 测试 程序 。 


.code 
main PROC 
mov ebx,OFFSET intArray ? 指向 数组 
mov ecx,LENGTHOF intArray ; 循环 计数 器 
L1: cmp WORD PTR [ebx],0 ;将 数值 与 0 比较 
jnz found 寻找 数值 
add ebx,2 ; 指向 下 一 个 元 素 
loop Ll1 ; 继续 循环 
jmp notFound ; 没有 发 现 非 零 数值 
found: ; 显示 数值 
movsx eax,WORD PTRIebx] ; 送 入 EAX 并 进行 符号 扩展 


call WriteInt 
jmp quit 
notFouna : 
mov edx,OFFSET noneMsg 
call WriteString 


;显示 “没有 发 现 ” 消 息 


quit: 
Call CLE 
exit 
main ENDP 
END main 


2. 应 用 : 简单 字符 串 加 密 

XOR 指令 有 一 个 有 趣 的 属性 。 如 果 一 个 整数 X 与 Y 进行 XOR， 其 结果 再 次 与 Y 进行 
XOR， 则 最 后 的 结果 就 是 XX: 

((X@DY) OY)=X 

XOR 的 可 逆 性 为 简单 数据 加 密 提 供 了 一 种 方便 的 途径 : 明文 消息 转换 成 加 密 字符 串 ， 
这 个 加 密 字 符 串 被 称 为 密 文 ， 加 密 方法 是 将 该 消息 与 被 称 为 密 钥 的 第 三 个 字符 串 按 位 进行 
XOR 操作 。 预 期 的 查看 者 可 以 用 密 钥 解密 密 文 ， 从 而 生成 原始 的 明文 。 

示例 程序 下 面 将 演示 一 个 使 用 对 称 加 密 的 简单 程序 ， 即 用 同一 个 密 钥 既 实现 加 密 又 实 
现 解 密 的 过 程 。 运 行 时 ， 下 述 步 又 依 序 发 生 : 

1 ) 用 户 输入 明文 。 

2 ) 程序 使 用 单字 符 密 钥 对 明文 加 密 ， 产 生 密 文 并 显示 在 屏幕 上 。 

3 ) 程序 解密 密 文 ， 产 生 初 始 明 文 并 显示 出 来 。 

下 面 是 该 程序 的 输出 示例 : 


CWROOWS tom md er 
ENEEF ERe FCT 


程序 清单 


Cipher text: 


Decrypted: 


(A sd Wd 
Bank account rh 





完整 的 程序 清单 如 下 所 示 : 
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; 加 密 程序 (Encrypt .asm) 
INCLUDE Irvine32.inc 

KEY = 239 ;1-255 之 间 的 任 一 值 
BUFMAX = 128 ; 缓冲 区 的 最 大 容量 

.data 

sPrompt BYTE "Enter the Plain text:",0 

sEncrypt BYTE "Cipher text: nd 

sDecrypt BYTE "Decrypted: 站 , 汐 


buffer BYTE BUFMAX+1 DUP(0) 
bufSize DWORD ? 


.Code 

main PROC 
call InputThestring ; 输入 明文 
call TranslateBuffer ; 加 密 缓冲 区 


mov edx,OFFSET sEncrypt; 显示 加 密 消息 
call DisplayMessage 

call TranslateBuffer ; 解密 缓冲 区 
mov ”edx,OFFSET sDecrypt ; 显示 解密 消息 
call DisplayMessage 


InputTheString PROC 

; 提示 用 户 输 入 一 个 纯 文 本 字符 串 。 
; 保存 字符 串 和 它 的 长 度 。 

7 接收 : 无 


pushad ; 保存 32 位 寄存 器 
mov edx,OFFSET sPrompt ; 显示 提示 
call WriteString 


mov ecx,BUFMAX ; 字符 计数 器 最 大 值 
mov ”edx,OFFSET buffer ;指向 缓冲 区 

call Readstring ; 输入 字符 串 

mov bufSize,eax ; 保存 长 度 

call Crlf£ 

popad 

ret 


InputTheString ENDP 


DisplayMessage PROC 


; 显示 加 密 或 解密 消息 。 
; 接收 : EDX 指向 消息 
i 返回: 无 


call WriteString 

mov edx,OFFSET buffer ; 显示 缓冲 区 
call Writestring 

call Cr1f 

Call Crlf 
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TranslateBuffer PROC 


;字符 囊 的 每 个 字 节 都 与 密 铀 字 节 进行 异 或 
;实现 转换 。 


pushad : 

mov ecx,bufSize ; 循环 计数 器 

mov esi,0 ; 缓冲 区 索引 初 值 同 0 
L1 : 

xor ”buffer[esil],KEY; 转换 一 个 字 节 

inc esi ; 指向 下 一 个 字 节 


TranslateBuffer ENDP 
END main 


不 要 用 单字 符 密 钥 来 加 密 重 要 数据 ， 因 为 它 太 容易 被 破译 了 。 反 之 


字符 密 钥 来 对 明文 进行 加 密 和 解密 。 
6.3.5 ”本 节 回 顾 


1 
2 
3 
4. 
| 
6 


. 哪些 跳 转 指 令 用 于 无 符号 整数 比较 ? 

. 哪些 跳 转 指 令 用 于 有 符号 整数 比较 ? 

.与 JNAE 等 价 的 条 件 跳 转 指令 是 哪 条 ? 

与 JNA 指令 等 价 的 条 件 跳 转 指令 是 哪 条 ? 

.与 JNGE 指令 等 价 的 条 件 跳 转 指令 是 哪 条 ? 

. (是 / 否 ): 下 面 的 代码 会 跳 转 到 标号 Target 吗 ? 


mov ax, 8109h 
cmp ax,26h 
jg Target 


6.4 ”条件 循环 指令 


6.4.1 LOOPZ 和 LOOPE 指令 


LOOPZ (为 零 跳 转 ) 指令 的 工作 和 LOOP 指令 相同 ， 只 是 有 一 个 附加 条 件 : 为 零 控 制 转 
向 目的 标号 ， 零 标志 位 必须 置 1。 指 令 语 法 如 下 : 


LOOPZ destination 
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， 本 章 习题 建议 用 多 


LOOPE (相等 跳 转 ) 指令 相当 于 LOOPZ, 它们 有 相同 的 操作 码 。 这 两 条 指令 执行 如 下 
任务 : 


ECX = ECX - 1 
if ECX > 0 and ZF = 1, jump to destination 


否则 ， 不 发 生 跳 转 ， 并 将 控制 传递 到 下 一 条 指令 。LOOPZ 和 LOOPE 不 影响 任何 状态 
标志 位 。32 位 模式 下 ，ECX 是 循环 计数 器 ; 64 位 模式 下 ，RCX 是 循环 计数 器 。 
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6.4.2 LOOPNZ 和 LOOPNE 指令 


LOOPNZ ( 非 零 跳 转 ) 指令 与 LOOPZ 相对 应 。 当 ECX 中 无 符号 数值 大 于 零 ( 减 1 操作 
之 后 ) 且 零 标志 位 等 于 零 时 ， 继 续 循 环 。 指 令 语法 如 下 : 

LOOPNZ destination 

LOOPNE (不 等 跳 转 ) 指令 相当 于 LOOPNZ， 它们 有 相同 的 操作 码 。 这 两 条 指令 执行 如 
下 任务 : 

ECX = ECX - 1 

if ECX > 0 and ZF = 0, jump to destination 

和 否则， 不 发 生 跳 转 ， 并 将 控制 传递 到 下 一 条 指令 。 

示例 下 面 摘录 的 代码 (来 源 : Loopnz.asm) 扫描 数组 中 的 每 一 个 数 ， 直 到 发 现 一 个 非 
负数 (符号 位 为 0 ) 为 止 。 注 意 ， 在 执行 ADD 指令 前 要 把 标志 位 压 人 堆栈 ,因为 ADD 有 可 
能 修改 标志 位 。 然 后 在 执行 LOOPNZ 指令 之 前 ， 用 POPFD 恢复 这 些 标 志 位 : 


.data 
array SWORD -3,-6,-1,-10,10,30,40,4 
sentinel SWORD 0 


.Code 
mov esi,OFFSET array 
mov ecx, LENGTHOF array 
Ll: test WORD PTR [esi],8000h  ; 测试 符号 位 
pushfd ; 标志 位 入 栈 
add esi, TYPE array ; 移动 到 下 一 个 位 置 
popfd ; 标志 位 出 模 
loopnz Lil 7 继续 循环 
jnz quit ; 没有 发 现 非 负 数 
sub esi,TYPE array ;ESI 指向 数值 
quit: 


如 果 找 到 一 个 非 负 数 ，ESI 会 指向 该 数值 。 如 果 没 有 找到 一 个 正 数 ， 则 只 有 当 ECX=0 
时 才 终 止 循环 。 在 这 种 情况 下 ，JNZ 指令 跳 转 到 标号 quit， 同 时 ESI 指向 标记 值 (0 )， 其 在 
内 存 中 的 位 置 正好 紧 接 着 该 数组 。 


6.4.3 ”本 节 回 顾 


1. ( 真 / 假 ): 当 ( 且 仅 当 ) 零 标 志 位 被 清除 时 ，LOOPE 指令 跳 转 到 标号 。 

2. ( 真 / 假 ): 32 位 模式 下 ， 当 ECX 大 于 零 且 零 标志 位 被 清除 时 ，LOOPNZ 指令 跳 转 到 标号 。 

3.( 真 1/ 假 ): LOOPZ 指令 的 目的 标号 必须 处 在 距离 其 后 指令 的 -128 到 +127 字 节 范围 之 内 。 

4. 修改 6.4.2 节 中 的 LOOPNZ 示例 ， 使 之 扫描 数组 并 搜索 其 中 的 第 一 个 负数 。 改 变数 组 的 
初始 化 ， 用 正 数 作为 其 起 始 值 。 

5. 挑战 : 6.4.2 节 的 LOOPNZ 示例 依靠 一 个 标记 值 来 处 理 没有 发 现 正 数 的 可 能 性 。 如 果 把 这 

` 个 标记 值 去 掉 ， 会 发 生 什么 ? 


6.5 条 件 结构 


条 件 结构 被 定义 为 ， 能 够 在 不 同 的 逻辑 分 支 中 触发 选择 的 一 个 或 多 个 条 件 表达 式 。 每 一 个 
分 支 都 执行 不 同 的 指令 序列 。 毫 无 疑问 ， 在 高 级 编程 语言 中 已 经 使 用 了 条 件 结构 ， 但 是 你 可 能 
并 不 了 解 语言 编译 器 是 如 何 将 条 件 结构 转换 为 低级 机 器 代码 的 。 现 在 就 来 讨论 这 个 转换 过 程 。 
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6.5.1 块 结构 的 IF 语句 


IF 结构 包含 一 个 布尔 表达 式 ， 其 后 有 两 个 语句 列表 : 一 个 是 当 表达 式 为 真 时 执行 ， 另 一 
个 是 当 表 达 式 为 假 时 执行 : 
if( boolean-expression ) 
statement-list-1 
else 
statement-1list-2 


结构 中 的 else 部 分 是 可 选 的 。 在 汇编 语言 中 ， 则 是 用 多 个 步骤 来 实现 这 种 结构 的 。 首 
先 ， 对 布尔 表达 式 求 值 ， 这 样 一 来 某 个 CPU 状态 标志 位 会 受到 影响 。 然 后 ， 根 据 相 关 CPU 
状态 标志 位 的 值 ， 构 建 一 系列 跳 转 把 控制 传递 给 两 个 语句 列表 。 

示例 1 下 面 的 C++ 代 码 中 ， 如 果 op1 等 于 op2， 则 执行 两 条 赋值 语句 : 


if( opl == 6p2 1 
{ 
xX 
LE 


1; 
2; 


中 外 


] 


在 汇编 语言 中 ， 这 种 下 语句 转换 为 条 件 跳 转 和 CMP 指令 。 由 于 opl 和 op2 都 是 内 存 
操作 数 (变量 )， 因 此 ， 在 执行 CMP 之 前 ,要 将 其 中 的 一 个 操作 数 送 和 寄存器。 下面 实现 If 
语句 的 程序 是 高 效 的 ， 当 轩 辑 表达 式 为 真 时 ， 它 允许 代码 “通过 ”直达 两 条 期 望 被 执行 的 
MOV 指令 : 


mov eax, opl 


cmp eax, op2 ; Opl1 == op2? 
jne LL1 ; 否 : 跳 过 后 续 指 令 
ob 浆 ; 二 ; 是 : X,Y 赋值 
mov  Y,2 


下 


如 果 用 下 来 实现 二 运算 符 ， 生成 的 代码 就 没有 那么 紧凑 了 (6 条 指令 ,而 非 5 条 


指令 ): 


mov eax, opl 


cmp eax, op2 ; op1L == Op2? 

je L1 ; 是 : 跳 转 到 LL 

jmp L2 ; 否 : 跳 过 赋值 语句 
Lis moOv Rl ;Xx，Y 赋值 


mov Yi 
L2: 


从 上 面 的 例子 可 以 看 出 ， 相 同 的 条 件 结构 在 汇编 语言 中 有 多 种 实现 方法 。 本 章 给 出 


的 编译 代码 示例 只 代表 一 种 假想 的 编译 器 可 能 产生 的 结果 。 


示例 2 NTFS 文件 存储 系统 中 ， 磁 盘 复 的 大 小 取决 于 磁盘 卷 的 总 容量 。 如 下 面 的 伪 代 
码 所 示 ， 如 果 卷 大 小 (用 变量 terrabytes 存放 ) 不 超过 16TB， 则 簇 大 小 设置 为 4096。 否 则 ， 
簇 大 小 设置 为 8192: 


clusterSize = 8192; 
if terrabytes < 16 
clusterSize = 4096; 


用 汇编 语言 实现 该 伪 代 码 : 
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mov clusterSize,8192 ; 假设 较 大 的 磁盘 千 
cmp terrabytes，16 ;小 于 16TB? 
jae next 


mov clusterSize,4096 ; 切换 到 较 小 的 磁盘 靠 


next: 


示例 3 下 面 的 伪 代 码 有 两 个 分 支 : 


if opi > op2 

call Routinel 
else 

call Routine2 
end if 


用 汇编 语言 翻译 这 段 伪 代 码 ， 设 op1 和 op2 是 有 符号 双 字 变量 。 对 这 两 个 变量 比较 时 ， 
其 中 一 个 必须 送 入 寄存 器 : 


mov eax,opl ; op1 送 入 寄存 器 
cmp eax,op2 ; Opl > op2? 
jg Al ; 是 : 调用 Routinel 
call Routine2 ; 否 ; 调用 Routine2 
jmp A2 ; 退出 IE 语句 

Al: call Routinel 

A2: 

白 盒 测 试 


复杂 条 件 语句 可 能 有 多 个 执行 路 径 ， 这 使 得 它们 难以 进行 调试 检查 (查看 代码 )。 程 序 
员 经 常 使 用 的 技术 称 为 白 盒 测试 ， 用 来 验证 子 程序 的 输入 和 相应 的 输出 。 白 盒 测试 需要 源 代 
码 ， 并 对 输入 变量 进行 不 同 的 赋值 。 对 每 个 输入 组 合 ， 要 手动 跟踪 源 代码 ， 验 证 其 执行 路 径 
和 子 程序 产生 的 输出 。 下 面 ， 通 过 和 骨 套 IF 语句 的 汇编 程序 来 看 看 这 个 测试 过 程 : 


if opl == op2 
4 
call Routinel 
else 
call Routine2 
end if 
else 
call Routine3 
end if 


下 面 是 可 能 的 汇编 语言 翻译 ， 加 上 了 参考 行 号 。 程 序 改 变 了 初始 条 件 (op1==op2 )， 并 
立即 跳 转 到 ELSE 部 分 。 剩 下 要 翻译 的 内 容 是 内 层 IF-ELSE 语句 : 


1 IOV eax, opl 
: cmp eax, op2 7 Opl == op2? 
3 : jne 1L2 ; 否 : 调用 Routine3 


; 处 理 内 层 IF-ELSE 语句 。 


4 mov eax,X 

ms cmp eax,Y 1 

6: jg L1 ; 是 : 调用 Routinel 
Ts call Routine2 ; 否 : 调用 Routine2 
8: jmp LL3 : ; 退出 

9: Ll: call Routinel ; 调用 Routinel 
10: jmp LL3 ;退出 

1I1: L2: call Routine3 
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表 6-6 给 出 了 示例 代码 的 白 盒 测试 结果 。 前 四 列 对 op1、op2、X 和 YY 进行 测试 赋值 。 
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第 5 列 和 第 6 列 对 生成 的 执行 路 径 进行 了 验证 。 
表 6-6 ”测试 嵌 套 IF 语句 





6.5.2 ”复合 表达 式 
1. 逻辑 AND 运算 符 


汇编 语言 很 容易 实现 包含 AND 运算 符 的 复合 布尔 表达 式 。 考 虑 下 面 的 伪 代 码 ， 假 设 其 


中 进行 比较 的 是 无 符号 整数 : 


if (al > bl) AND (bl > c]) 


X=1 
end if 


短路 求 值 下面 的 例子 是 短路 求 值 的 简单 实现 ， 如 果 第 一 个 表达 式 为 假 ， 则 不 需 计算 第 


二 个 表达 式 。 高 级 语言 的 规范 如 下 : 


cmp 
ja 
jmp 
Lls wap 
ja 
jmp 
L2; mov 
next: 


如 果 把 第 一 条 JA 指令 替换 为 JBE， 就 可 以 把 代码 减少 到 5 条; 


cmp 
jbe 
cmp 
jbe 
mov 

next: 


车 第 一 个 JBE 不 执行 ，CPU 可 以 直接 执行 第 二 个 CMP 指令 ， 这 样 就 能 够 减少 29% 的 


al,bl ;第 一 个 表达 式 … 


next 

bl,cl ;第 二 个 表达 式 … 
L2 

next 

> ; 全 为 真 : 将 XxX 置 1 


al,bl ; 第 一 个 表达 式 … 
next ; 如 果 假 ， 则 退出 
bi ; 第 二 个 表达 式 … 
next ; 如 果 假 ， 则 退出 
X,1 ; 全 为 真 


代码 量 (指令 数 从 7 条 减少 到 5 条 )。 
2. 逻辑 OR 运算 符 


当 复 合 表达 式 包含 的 子 表达 式 是 用 OR 运算 符 连接 的 ， 那么 只 要 一 个 子 表达 式 为 真 ， 则 


整个 复合 表达 式 就 为 真 。 以 如 下 伪 代码 为 例 : 


if (al > bl) OR (bl > cl1) 


X=1 


在 下 面 的 实现 过 程 中 ， 如 果 第 一 个 表达 式 为 真 ， 则 代码 分 支 到 L1 ; 否则 代码 直接 执行 
第 二 个 CMP 指令 。 第 二 个 表达 式 翻 转 了 > 运算 符 ， 并 使 用 了 JBE 指令 : 


cmp 
ja 
cmp 


al,bl ;1: 比较 AL 和 BL 
L1 7 如 果真 ， 跳 过 第 二 个 表达 式 
bl,cl ;2; 比较 BL 和 CL 
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jbe next ; 假 ; 跳 过 下 一 条 语句 
L1l: mov  X,1 ; 真 : 将 X 置 1 
next: 


对 于 一 个 给 定 的 复合 表达 式 而 言 ， 汇 编 语 句 有 多 种 实现 方法 。 
6.5.3 WHILE 循环 


WHILE 循环 在 执行 语句 块 之 前 先进 行 条 件 测试 。 只 要 循环 条 件 一 直 为 真 ， 那 么 语句 块 
就 不 断 重 复 。 下 面 是 用 C++ 编写 的 循环 : 

whilel( vall < val2 ) 

, vall++; 


val2--; 
} 


用 汇编 语言 实现 这 个 结构 时 ， 可 以 很 方便 地 改变 循环 条 件 ， 当 条 件 为 真 时 ， 跳 转 到 
endwhile。 假 设 vall 和 val2 都 是 变量 ， 那 么 在 循环 开始 之 前 必须 将 其 中 的 一 个 变量 送 入 寄 
存 器 ， 并 且 还 要 在 最 后 恢复 该 变量 的 值 : 


mov eax,vall ; 把 变量 复制 到 EAX 

beginwhile: 

cmp eax,val2 ; 如 果 非 vall < val2 

jnl endwhile ; 退出 循环 

inc eax ; vall+t+; 

dec val2 ; Val2--; 

jmp beginwhile ; 重复 循环 
endwhile: 


mov vall,eax 


; 保存 vall 的 新 值 


在 循环 内 部 ，EAX 是 vall 的 代理 (替代 品 )， 对 vall 的 引用 必须 要 通过 EAX。JNL 的 
使 用 意味 着 vall 和 val2 是 有 符号 整数 。 
示例 : 循环 内 的 IF 语句 钳 套 
高 级 语言 尤其 善于 表示 典 套 的 控制 结构 。 如 下 C++ 代码 所 示 ， 在 一 个 WHILE 循环 中 有 
嵌 套 正 语句 。 它 计算 所 有 大 于 sample 值 的 数组 元 素 之 和 : 
int array[] = {10,60,20,33,72,89,45,65.,72,18}); 
int sample = 50; 
int ArraySize = sizeof array / sizeof sample; 
int index = 0; 
int sum = 0; 
while( index < ArraySize ) 
{ 
if( array[index] > sample ) 
{ 
sum += array[index]; 
} 


index++; 


} 


在 用 汇编 语言 编写 该 循环 之 前 ， 用 图 6-1 的 流程 图 来 说 明 其 逻辑 。 为 了 简化 转换 过 
程 ， 并 通过 减少 内 存 访问 次 数 来 加 速 执行 ， 图 中 用 寄存 器 来 代替 变量 : EDX=sample， 
EAX=sum，ESI=index，ECX=ArraySize (常数 )。 标 号 名 称 也 已 经 添加 到 逻辑 框 上 。 

汇编 代码 ”从 流程 图 生成 汇编 代码 最 简单 的 方法 就 是 为 每 个 流程 框 编写 单独 的 代码 。 注 
意 流程 图 标签 和 下 面 源 代码 使 用 标签 之 间 的 直接 关系 (参阅 Flowchart.asm ): 
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.data 

sum DWORD 0 

sample DWORD 50 

array DWORD 10,60,20,33,72,89,45,65,72,18 


ArraySize = ($ - Array) / TYPE array 
.Code 
main PROC 
mov eax,0 ; 求 和 
mov edx, sample 
mov esi,0 ; 索引 
mov ecx,ArraySize 
Ll: cmp esi,ecx ; 如果 esi < ecx 
ey L2 
jmp LS5 
L2; cmp array[esi*4]，edx ; 如 果 array[esi] > edx 
jg L3 
jmp L4 


L3: add eax,array [esi*4] 
L4: inc esi 
jmp Ll 


L5: mov sum, eax 


6.5 节 最 后 的 一 个 回顾 问题 将 提供 机 会 来 改进 上 述 代码 。 








cax—=sum 





dex=sample 
esi=index 
ecx=ArraySize 


真 KCarray[esi] > edx? 


L3: 


6.5.4” 表 驱动 选择 
表 了 驱动 选择 是 用 查 表 来 代替 多 路 选择 结构 的 一 种 方法 。 使 用 这 种 方法 ,需要 新 建 一 个 
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表 ， 表 中 包含 查询 值 和 标号 或 过 程 的 偏 移 量 ， 然 后 必须 用 循环 来 检索 这 个 表 。 当 有 大 量 比较 
操作 时 ， 这 个 方法 最 有 效 。 


例如 ， 下 面 是 一 个 表 的 一 部 分 ， 该 表 包 含 单 字符 查询 值 ， 以 及 过 程 的 地 址 : 


.data 

CaseTable BYTE  ”'A' ; 查询 值 
DWORD Process_A ; 过程 地 址 
BYTE 'B' 
DWORD Process_B 
(etc.) 


假设 Process_A、Process_B、Process_C 和 Process_D 的 地 址 分 别 是 120h、130h、140h 
和 150h。 上 表 在 内 存 中 的 存放 如 图 6-2 所 示 。 


[xm | w | oo00030 Te T00000140 | 5 | 00000150 | 






查询 值 
6-2 ”过 程 偏 移 量 表 


示例 程序 下面 的 示例 程序 (ProcTable.asm) 中 ， 用 户 从 键盘 输入 一 个 字符 。 通 过 循 
环 ， 该 字符 与 表 的 每 个 表 项 进行 比较 。 第 一 个 匹配 的 查询 值 将 会 产生 一 个 调用 ， 调 用 对 象 是 
紧 接 在 该 查询 值 后 面 的 过 程 偏 移 量 。 每 个 过 程 加 载 到 EDX 的 偏 移 量 都 代表 了 一 个 不 同 的 字 
符 串 ， 它 将 在 循环 中 显示 : 


; 过 程 偏 移 量 表 
; 本 程序 包含 了 过 程 偏 移 量 表格 。 
; 它 用 这 个 表格 执行 间接 过 程 调用 。 


INCLUDE Irvine32.inc 

.data 

CaseTable BYTE 'A' ; 查询 值 
DWORD ”Process_A ; 过 程 地 址 

EntrySize = ($ - CaseTable) 
人 
DWORD 
BYTE 'C' 
DWORD 
BYTE “了 
DWORD Process_D 

NumberOfEntries = ($ - CaseTable) / EntrySize 

prompt BYTE "Press capital A,B,C,or D: ",0 


为 每 个 过 程 定义 一 个 单独 的 消息 字 串 : 


(ProcTable .asm) 


Process_B 


Process_C 


msgA BYTE 
msgB BYTE 
msgC BYTE 


msgD BYTE 
-code 


main PROC 
mov 
call 
call 
mov 


"Process_A",0 
"Process_B",0 
"Process_C",0 
"Process_D",0 


edx,OFFSET prompt ; 请 求 用 户 输入 
WriteString 
ReadChar 


ebx,OFFSET CaseTable 


7 读 取 字符 到 AL 
;? 设 EBX 为 表 指 针 
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mov ecx,NumberOfEntries ; 循环 计数 器 


Ls 
cmp al, [ebx] ; 发 现 匹 配 项 ? 
jne 12 7 否 : 继续 
call NEAR PTR [ebx + 1] ; 是: 调用 过 程 


这 个 CALL 指令 调用 过 程 ， 其 地 址 保存 在 EBX+1 指向 的 内 存 位 置 中 。 像 这 样 的 间 





接 调用 需要 使 用 NEAR PTR 运算 符 。 


call WriteStting ; 显示 消息 
call Crlf 
jmp L3 ; 退出 搜索 
L2: 
add ebx,EntrySize ;指向 下 一 个 表 项 
loop L1 ; 重复 直到 ECX=0 
L3: 
exit 
main ENDP 


下 面 的 每 个 过 程 向 EDX 加 载 不 同 字 符 串 的 偏 移 量 : 


Process_A PROC 
mov edx,OFFSET msgaA 
ret 

Process_A ENDP 


Process_B PROC 
mov edx,OFFSET msgB 
ret 

Process_B ENDP 


Process_C PROC 
mov edx,OFFSET msgC 
ret 

Process_C ENDP 


Process_D PROC 
mov edx,OFFSET msgD 
ee ENDP 
END main 
表 驱 动 选择 有 一 些 初始 化 开销 ， 但 是 它 能 减少 编写 的 代码 总 量 。 一 个 表 就 可 以 处 理 大 量 
的 比较 ， 并 且 与 一 长 串 的 比较 、 跳 转 和 CALL 指令 序列 相 比 ， 它 更 加 容易 修改 。 甚 至 在 运 
行 时 ， 表 还 可 以 重新 配置 。 


6.5.5 ”本 节 回 顾 
注意 : 所 有 复合 表达 式 都 使 用 短路 求 值 。 假 设 vall 和 XX 是 32 位 变量 。 
1. 用 汇编 语言 实现 下 述 伪 代码 : 


if ebx > ecx 
.和 


2. 用 汇编 语言 实现 下 述 伪 代 码 : 


if edx <= ecx 


X=1 
else 
和 = 2 
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3. 对 6.5.4 节 中 的 程序 来 说 ， 为 什么 让 汇编 器 计算 NumberOfEntries 比 对 其 赋值 (如 
NumberOfEntries=4 ) 效果 更 好 ? 


4. 挑战 : 重新 编写 6.5.3 节 中 的 代码 ， 使 其 功能 不 变 ， 但 指令 数 更 少 。 


6.6 应 用 : 有 限 状 态 机 


有 限 状态 机 (FSM) 是 一 个 根据 输入 改变 状态 的 机 器 或 程序 。 用 图 表示 FSM 相当 简明 ， 
图 中 的 矩形 (或 圆 形 ) 称 为 节点 ， 节 点 之 间 带 箭头 的 线段 称 为 边 (或 弧 )。 

图 6-3 给 出 了 一 个 简单 的 例子 。 每 个 节点 代表 一 个 程序 状 。 。 开 | 
态 ， 每 个 边 代表 从 一 个 状态 到 另 一 个 状态 的 转换 。 一 个 节点 被 i 
指定 为 初始 状态 ， 在 图 中 用 一 个 输入 箭头 指出 。 其 余 的 状态 可 
以 用 数字 或 字母 来 标示 。-- 个 或 多 个 状态 可 以 指定 为 终止 状态 ， 图 6-3 简单 的 有 限 状态 机 
用 粗 框 矩 形 表示 。 终 止 状态 表示 程序 无 出 错 的 结束 状态 。FSM 是 一 种 被 称 为 有 向 图 的 更 一 
般 结构 的 特例 。 有 向 图 就 是 一 组 节点 ， 它 们 用 具有 特定 方向 的 边 进行 连接 。 


6.6.1 验证 输入 字符 串 


读 取 输 入 流 的 程序 往往 要 通过 执行 一 定量 的 错误 检查 来 验证 它们 的 输入 。 比 如 ， 编 程 语 
言 编译 器 可 以 用 FSM 来 扫描 程序 ， 将 文字 和 符号 转换 为 记号 (通常 是 指 关键 字 、 算 法 运算 
符 和 标识 符 )。 

用 FSM 来 验证 输入 字符 串 时 ， 常 常 是 按 字 符 进 行 读 取 。 每 一 个 字符 都 用 图 中 的 一 条 边 
(转换 ) 来 表示 。FSM 有 两 种 方法 检测 非法 输入 序列 : 

e 下 一 个 输入 字符 没有 对 应 到 当前 状态 的 任何 一 个 转换 。 

e 输入 已 经 终止 ， 但 是 当前 状态 是 非 终 止 状态 。 

字符 串 示例 “现在 根据 下 面 两 条 原则 来 验证 一 个 输入 字符 串 : 

e 该 字符 串 必须 以 字母 “x” 开 始 ， 以 字母 “z” 结 束 。 

e 第 一 个 和 最 后 一 个 字符 之 间 可 以 有 零 个 或 多 个 字母 ,但 其 范围 必须 是 fa，…，y}。 

图 6-4 的 FSM 显示 了 上 述 语法 。 每 一 个 转换 都 是 由 特定 类 型 的 输入 来 标识 。 比 如 ， 仅 
当 从 输入 流 中 读 取 字母 x 时 ， 才 能 完成 状态 A 到 状态 B 的 转换 。 输 入 任何 非 “z” 的 字母 ， 
都 会 使 得 状态 B 转换 为 其 自身 。 而 仅 当 从 输入 流 中 读 取 字母 z 时 ， 才 会 发 生 状 态 B 到 状态 
C 的 转换 。 


如 果 输 入 流 已 经 结束 ， 而 程序 只 出 现 了 状态 A 和 状态 B, 那 jw ww 只 
么 就 生成 出 错 条 件 ， 因 为 只 有 状态 C 才能 标记 终止 状态 。 下 述 输 
入 字符 申 能 被 该 FSM 认可 : 2 
Ss 图 6-4 字符 串 的 FSM 
xyyqqrrstuvz 


6.6.2 ”验证 有 符号 整数 
图 6-5 表示 的 是 FSM 解析 一 个 有 符号 整数 。 输 入 包括 一 个 
可 选 的 前 置 符号 ， 其 后 跟 一 串 数 字 。 图 中 没有 对 数字 个 数 进行 


限制 。 图 6-5 有 符号 十 进 制 整数 
有 限 状 态 机 很 容易 转换 为 汇编 代码 。 图 中 的 每 个 状态 ( A、 FSM 
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B、 


C… ) 代表 了 一 段 有 标号 的 程序 。 每 个 标号 执行 的 操作 如 下 : 


1 ) 调用 输入 程序 读 人 下 一 个 输入 字符 。 
2 ) 如 果 是 终止 状态 ， 则 检查 用 户 是 否 按 下 Enter 键 来 结束 输入 。 
3 ) 一 个 或 多 个 比较 指令 检查 从 状态 发 出 的 所 有 可 能 的 转换 。 每 个 比较 指令 后 面 跟 一 个 


条 件 跳 转 指令 。 
比如 ， 在 状态 A， 如 下 代码 读 取 下 一 个 输入 字符 并 检查 到 状态 B 的 可 能 的 转换 : 
StateAa: 
Ca Oriext ; 读 取 下 一 个 字符 ， 并 送 入 AL 
cmp al,'+! 前 量 +? , 
je StateB ; 到 状态 B 
cmp al,'-’ ; 前 置 -? 
je StateB ; 到 状态 B 
call IsDigit ; 如 果 AL 包含 数字 ， 则 ZF=1 
jz StateC ; 到 状态 C 
call DisplayErrorMsg ;发 现 非法 输入 
jmp Quit 


型 训 


下 面 来 更 详细 地 检查 这 段 代码 。 首 先 ， 代 码 调用 Getnext， 从 控制 台 输 入 读 取 下 一 个 字 


送信 AL 寄存 器 。 接 着 检查 前 置 + 或-， 先 将 AL 的 值 与 符号 “ +” 进行 比 较 ， 如 果 匹 
， 就 发 生 到 标号 StateB 的 跳 转 : 
StateA: 
call Getnext ; 读 取 下 一 个 字符 ， 并 送 入 AL 
emp al,'+' ; 前 置 +? 
je StateB ; 到 状态 B 


现在 ， 再 次 查看 图 6-5， 发 现 只 有 输入 + 或 一 时 ， 才 发 生 状 态 A 到 状态 B 的 转换 。 所 


， 代 码 还 需 检查 减 号 : 


cmp al,'-' ;前 置 -? 
je StateB ; 到 状态 B 


如 果 无 法 发 生 到 状态 B 的 转换 ， 就 可 以 检查 AL 寄存 器 中 是 否 为 数字 ,这 可 以 导致 到 状 


态 C 的 转换 。( 从 本 书 的 链接 库 ) 调用 IsDigit 子 程序 ， 当 AL 包含 数字 时 ， 零 标志 位 置 1: 


字 ， 


call IsDigit ; 如 果 RL 包 含 数 字 ， 则 ZF=1 
jz StateC ; 到 状态 C 


最 后 ， 状 态 A 没有 其 他 可 能 的 转换 。 如 果 发 现 AL 中 的 字符 既 不 是 前 置 符号 ， 又 不 是 数 
程序 就 会 调用 DisplayErrorMsg (在 控制 台 上 显示 一 条 错误 消息 ) 子 程序 ， 并 跳 转 到 标号 


Qnuit 处 : 


call DisplayErrorMsg ;发 现 非法 输入 
jmp Quit 
标号 Quit 标识 程序 的 出 口 ， 位 于 主 程序 的 结尾 : 
Quit: 
Galli “CELE 
exit 
main ENDP 


完整 的 有 限 状 态 机 程序 ”如 下 程序 实现 图 6-5 所 示 的 有 符号 整数 FSM : 
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; 有 限 状态 机 (Finite.asm) 
INCLUDE Irvine32.inc 

ENTER_KEY = 13 

.data 

InvalidIinputMsg BYTE "Invalid input",13,10,0 
.Code 


main PROC 
call Clraecr 


StateRA: 
call Getnext ; 读 取 下 一 个 字符 ， 并 送 入 AL 
cmp al,'+!' ; 前 置 + ? 
je StateB ; 到 状态 B 
cmp al,'-! ; 前 置 -? 
je StateB ; 到 状态 B 
call IsDigit ; 如 果 AL 包含 数字 ， 则 ZF=1 
jz StateC ; 到 状态 C 
call DisplayErrorMsg ; 发 现 非法 输入 
jmp Quit 
StateB: 
call Getnext 7 读 取 下 一 个 字符 ， 并 送 入 AL 
call IsDigit ; 如 果 AL 包含 数字 ， 则 ZF=1 


jz StateC 
call DisplayErrorMsg ; 发 现 非法 输入 
jmp Quit 
tecC : 
et Getnext ; 读 取 下 一 个 字符 ， 并 送 入 AL 
call IsDigit 7 如 果 AL 包含 数字 ， 则 ZF=1 
jz StateC 
cmp al,ENTER_KEY ; 按 下 Enter 键 ? 
je Quit ; 是 : Quit 
call DisplayErrorMsg ; 否 : 发 现 非法 输入 
jmp Quit 


Call CElf 


Getnext PROC 


; 从 标准 输入 读 取 一 个 字符 。 
;接收 ; 无 
; 返回 : 字符 保存 在 AL 中 


call ReadChar ， 从 键盘 输入 
call WriteChar ;显示 在 屏幕 上 
ret 

Getnext ENDP 


DisplayErrorMsg PROC 


; 显示 一 个 错误 消息 以 表示 
; 输入 流 中 包含 非法 输入 。 
7 接收 : 无 
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mov edx,OFFSET InvalidIinputMsg 
call Writestring 
pop edx 
ret 
DisplayErrorMsg ENDP 
END main 


IsDigit 子 程序 有限 状态 机 示例 程序 调用 IsDigit 子 程序 ， 该 子 程序 属于 本 书 的 链接 库 。 
现在 来 看 看 IsDigit 的 源 程序 ， 程 序 把 AL 寄存 器 作为 输入 ， 其 返回 值 设 置 零 标 志 位 : 


IsDigit PROC 


;确定 AL 中 的 字符 是 否 为 有 效 的 十 进 抽 数 字 。 
; 接收 : AL= 字符 
We 若 AL 为 有 效 的 十 进 制 字 符 ，ZF=1; 否则 ，ZF=0 


jb ID1 ; 跳 转 发 生 ，ZF=0 
cmp dl 
ja ID1 ; 跳 转 发 生 ，ZF=0 
test ax,0 ; 设置 ZF=1 

Dl: Yet 


IsDigit ENDP 


在 查看 IsDigit 的 代码 之 前 ， 先 回顾 十 进 制 数字 的 十 六 进 制 ASCII 码 ， 如 下 表 所 示 。 由 
于 这 些 值 是 连续 的 ， 因 此 ， aa 后。 





ASCI 码 (十 六 进 制 ) er 


IsDigit 子 程序 中 ， 开 始 的 两 条 指令 将 AL 寄存 器 中 字符 的 值 与 数字 0 的 ASCII 码 进行 比 
较 。 如 果 字 符 的 ASCII 码 小 于 0 的 ASCII 码 ， 程 序 跳 转 到 标号 ID1: 

cmp al,'0! 

TD ; 跳 转 发 生 ，ZF=0 


但 是 有 人 可 能 会 问 了 ， 如果 配 将 控制 传递 给 标号 ID1， 那 么 ， 怎 么 知道 零 标志 位 的 状 
态 呢 ? 答案 就 在 CMP 指令 的 执行 方式 里 一 一 它 执 行 一 个 隐 含 的 减法 操作 ， 从 AL 寄存 器 的 
字符 中 减 去 0 的 ASCII 码 (30h)。 如 果 AL 中 的 值 较 小 ， 那么 进位 标志 位 置 1， 零 标志 位 清 
除 (你 可 能 想 用 调试 器 来 单 步 执 行 这 段 代码 来 验证 这 个 事实 )。JB 指令 的 目的 是 ， 当 CF=1 
且 ZF=0 时 ,将 控制 传递 给 一 个 标号 。 

接 下 来 ，IsDigit 子 程序 代码 把 AL 与 数字 9 的 ASCII 码 进行 比较 。 如 果 AL 的 值 较 大 ， 
代码 跳 转 到 同一 个 标号 : 

cmp al,49: 

近 ID1 ; 跳 转 发 生 ，ZF=0 

如 果 AL 中 字符 的 ASCII 码 大 于 数字 9 的 ASCII 码 (39h)， 清 除 进 位 标志 位 和 零 标志 
位 。 这 也 正好 是 使 得 JA 指令 将 控制 传递 到 目的 标号 的 标志 位 组 合 。 

如 果 没 有 跳 转 发 生 (JA 或 了 本)， 又 假设 AL 中 的 字符 确实 是 一 个 数字 ， 则 插入 一 条 指 
令 确 保 将 零 标志 位 置 1。 将 0 与 任何 数值 进行 test 操作 ， 就 意味 着 执行 一 次 隐 含 的 与 全 0 的 
AND 运算 。 其 结果 必然 为 0: 


test ax,0 ; 置 ZF=1 
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224 





176 匈 6 莫 


前 面 IsDigit 中 的 JA 和 JB 指令 跳 转 到 了 TEST 指令 后 面 的 标号 。 所 以 ， 如 果 发 生 跳 转 ， 
零 标 志 位 将 清 零 。 下 面 再 次 给 出 完整 的 过 程 : 


Isdigit PROC 


cmp al,'0' 
jb ID1 ; 车 跳 转 发 生 ， 则 ZF=0 
cmp al,'9' 
ja IDl1 ; 若 跳 转发 生 ， 则 ZF=0 
test ax,0 ; 置 ZF=1 

ID1: ret 


Isdigit ENDP 


在 实时 或 高 性 能 应 用 中 ， 程 序 员 常 常 利用 硬件 特性 的 优势 ， 来 对 其 代码 进行 充分 优化 。 
IsDigit 过 程 就 是 这 种 方法 的 例子 ， 它 利用 JB 、JA 和 TEST 对 标志 的 设置 ， 实 际 上 返回 的 是 
一 个 布尔 结果 。 


6.6.3 ”本 节 回 顾 


1. 有 限 状态 机 是 哪 种 数据 结构 类 型 的 特殊 应 用 ? 

2. 在 有 限 状态 机 示意 图 中 ， 节 点 代表 什么 ? 

3. 在 有 限 状 态 机 示意 图 中 ， 边 代表 什么 ? 

4. 在 有 符号 整数 的 有 限 状 态 机 ( 6.6.2 节 ) 中 ， 若 输入 包含 “+5” 则 会 达到 哪个 状态 ? 

5. 在 有 符号 整数 的 有 限 状 态 机 ( 6.6.2 节 ) 中 ， 在 一 个 减 号 的 后 面 能 有 多 少 个 数字 ? 

6. 当 没有 输入 且 当 前 状态 为 非 终止 状态 时 ， 有 限 状 态 机 会 发 生 什么 情况 ? 

7. 下 图 中 简化 的 有 符号 十 进 制 整数 有 限 状 态 机 是 否 能 与 6.6.2 节 中 的 状态 机 一 样 工 作 ? 如 果 
不 能 ， 说 明 原因 。 


ep 


数字 
数字 
开始 A 人 


6.7 ”条件 控制 流 伪 指令 


32 位 模式 下 ，MASM 包 含 了 一 些 高 级 条 件 控 制 流 伪 指 令 (conditional control flow 
directives)， 这 有 助 于 简化 编写 条 件 语句 。 遗 憾 的 是 ， 这 些 伪 指令 不 能 用 于 64 位 模式 。 对 
程序 进行 汇编 之 前 ， 汇 编 器 执行 的 是 预 处 理 步 又。 在 这 个 步骤 中 ， 汇 编 器 要 识别 伪 指令 ， 
如 : .CODE、.DATA， 以 及 一 些 用 于 条 件 控制 流 的 伪 指 令 。 表 6-7 列 出 了 这 些 伪 指令 。 

表 6-7 ”条件 控制 流 伪 指令 


伪 指令 说 明 
.BREAK 生成 代码 终止 .WHILE 或 .REPEAT 块 
.CONTINUE 生成 代码 跳 转 到 .WHILE 或 .REPEAT 块 的 顶端 
.ELSE 当 .I 下 条 件 不 满足 时 ， 开 始 执行 的 语句 块 
.ELSEIF condition | 生成 代码 测试 condition， 并 执行 其 后 的 语句 ， 直 到 磁 到 一 个 .ENDIF 或 男 一 个 .ELSEIF 伪 指令 
.ENDIF 终止 .IF、.ELSE 或 .ELSEIF 伪 指 今后 面 的 语句 块 
.ENDW 终止 .WHILE 伪 指 令 后 面 的 语句 块 
.IF condition 如 果 condition 为 真 ， 则 生成 代码 执行 语句 块 
.REPEAT 生成 代码 重复 执行 语句 块 ， 直 到 条 件 为 真 


.UNTIL condirion | 生成 代码 重复 执行 .REPEAT 和 .UNTIL 伪 指 令 之 间 的 语句 块 ， 直 到 condition 为 真 
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( 续 ) 


.UNTILCXZ 生成 代码 重复 执行 .REPEAT 和 .UNTILCXZ 伪 指 令 之 间 的 语句 块 ， 直 到 CX 为 零 


.WHILE condition | 当 condition 为 真 时 ， 生 成 代码 执行 .WHILE 和 .ENDW 伪 指 令 之 间 的 语句 块 





[225 
6.7.1 新 建 IF 语句 


.IF、.ELSE、.ELSEIF 和 .ENDIF 伪 指 令 使 得 程序 员 易 于 对 多 分 支 逻 辑 进 行 编码 。 它 们 
让 汇编 器 在 后 台 生 成 CMP 和 条 件 跳 转 指令 ， 这 些 指令 显示 在 输出 列表 文件 ( progname.1st) 
中 。 语 法 如 下 所 示 : 


.IF conditionl 
statements 
[.ELSEIF condition2 
statements ] 

[ .ELSE 
statements ] 
,ENDIF 


方 括号 表示 .ELSEIF 和 .ELSE 是 可 选 的 ， 而 .IF 和 .ENDIF 则 是 必需 的 。condition (条 件 ) 
是 布尔 表达 式 ， 使 用 与 C++ 和 Java 相同 的 运算 符 (比如 : <、>、== 和 !=)。 表 达 式 在 运行 
时 计算 。 下 面 的 例子 给 出 了 一 些 有 效 的 条 件 ， 使 用 的 是 32 位 寄存 器 和 变量 : 


eax > 10000h 


vall <= 100 

Val2 == eax 

val3 != ebx 

下 面 的 例子 给 出 的 是 复合 条 件 : 
(eax > 0) && (eax > 10000h) 
{vall <= 100) || (val2 <= 100) 


(val2 != ebx) && !CARRY? 


表 6-8 列 出 了 所 有 的 关系 和 逻辑 运算 符 。 
表 6-8 ”运行 时 关系 和 逻辑 运算 符 


运算 符 说 明 
exprl==expr2 车 exprl 等 于 expr2， 则 返回 “ 真 ” 
exprl ! —expr2 若 exprl 不 等 于 expr2， 则 返回 “ 真 " 
exprl>expr2 车 exprl 大 于 expr2， 则 返回 “ 真 ” 
exprl > expr2 车 exprl 大 于 等 于 expr2， 则 返回 “ 真 ” 
exprl<expr2 车 exprl 小 于 expr2， 则 返回 “ 真 ” 
exprl < expr2 若 exprl 小 于 等 于 expr2， 则 返回 “ 真 ” 
! expr 若 expr 为 假 ， 则 返回 “ 真 ” 
exprlexpr2 对 exprl 和 expr2 执行 逻辑 AND 运算 
exprl || expr2 对 exprl 和 expr2 执行 逻辑 OR 运算 
exprl & expr2 对 exprl 和 expr2 执行 按 位 AND 运算 
CARRY ? 若 进位 标志 位 置 1， 则 返回 “ 真 ” 
OVERFLOW ? 若 溢出 标志 位 置 1， 则 返回 “ 真 ” 
PARITY ? 若 奇偶 标志 位 置 1， 则 返回 “ 真 ” 
SIGN ? 若 符号 标志 位 置 1， 则 返回 “ 真 ” 


ZERO ? 若 零 标志 位 置 1， 则 返回 “ 真 ” [2 
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在 使 用 MASM 条 件 伪 指令 之 前 ， 一 定 要 彻底 了 解 怎 样 用 纯 汇 编 语言 实现 条 件 分 支 
指令 。 此 外 ， 在 包含 条 件 伪 指令 的 程序 汇编 时 ， 要 查看 列表 文件 以 确认 MASM 生成 的 


代码 确实 是 编程 者 所 需要 的 。 


生成 ASM 代码 ” 当 使 用 如 .IF 和 .ELSE 一 样 的 高 级 伪 指令 时 ， 汇 编 器 将 为 程序 员 编写 
代码 。 例 如 ， 编 写 一 条 .IF 伪 指 令 来 比较 EAX 与 变量 vall: 


mov eax,6 

.IE eax > vall 
mov result,1 

.ENDIF 


假设 vall 和 result 是 32 位 无 符号 整数 ， 当 汇编 器 读 到 前 述 代 码 时 ， 就 将 它们 扩展 为 下 
述 汇编 语言 指令 ， 用 Visual Studio 调试 器 运行 程序 时 可 以 查看 这 些 指令 ， 操 作为 : 右键 点 
击 ， 选择 Go To Disassembly。 


mov eax, 6 
cmp eax,vall 
jbe  @C0O001 ; 无 符号 数 比 较 跳 转 
mov result,l 
ec0001 : 


标号 名 @C0001 由 汇编 器 创建 ， 这 样 可 以 确保 同一 个 过 程 中 的 所 有 标号 都 具有 唯一 性 。 


要 控制 MASM 生成 代码 是 否 显示 在 源 列表 文件 中 ， 可 以 在 Visual Studio 中 配置 
Project 的 属性。 步骤 如 下 : 在 Project 菜 单 中 ， 选 择 Project Properties， 选 择 Microsoft 








Macro Assembler， 选 择 Listing File， 再 设置 Enable Assembly Generated Code Listing 为 Yes。 


6.7.2 ”有 符号 数 和 无 符号 数 的 比较 


当 使 用 .IF 伪 指 令 来 比较 数值 时 ， 必 须 认识 到 MASM 是 如 何 生成 条 件 跳 转 的 。 如 果 比 
较 包 含 了 一 个 无 符号 变量 ,， 则 在 生成 代码 中 插入 一 条 无 符号 条 件 跳 转 指令 。 如 下 还 是 前 面 的 
例子 ， 比 较 EAX 和 无 符号 双 字 变量 vall: 


.data 
vall DWORD 和 
result DWORD ? 
.Code 
mov eax,6 
-IF eax > vall 
mov result,l1 


.ENDIF 
汇编 器 用 JBE (无 符号 跳 转 ) 指令 对 其 进行 扩展 : 
mov eax,6 

227 5 


mov LeSult,1 
@C0001: 


有 符号 数 比 较 ”如 果 .IF 伪 指 令 比 较 的 是 有 符号 变量 ， 则 在 生成 代码 中 插入 一 条 有 符号 
条 件 跳 转 指令 。 例 如 ，val2 为 有 符号 双 字 : 
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.data 
val2 SDWORD -1 
result DWORD ? 
.Code 
mov eax,6 
.IF eax > val2 
mov result,l 
.ENDIF 


因此 ， 汇 编 器 用 JLE 指令 生成 代码 ， 即 基于 有 符号 比较 的 跳 转 ; 
ee 


jle @C0001 ; 有 符号 比较 跳 转 


mov result,1 
@C0001: 


寄存 器 比较 那么， 现在 可 能 会 有 一 个 问题 : 如 果 是 两 个 寄存 器 进行 比较 ， 情 况 又 是 怎 
样 的 ? 显然 ， 汇 编 器 无 法 确定 寄存 器 中 的 数值 是 有 符号 的 还 是 无 符号 的 : 


mov eax, 6 

mov ebx,val2 

.IF eax > ebx 
mov result,1 

.ENDIF 


下 面 生成 的 代码 表示 汇编 器 将 其 默认 为 无 符号 数 比较 (注意 使 用 的 是 JBE 指令 ): 


mov eax,6 
mov ebx,val2 
cmp eax, ebx 
jbe ec0001 
mov result,l1 
@C0001: 


6.7.3 ”复合 表达 式 


很 多 复合 布尔 表达 式 使 用 逻辑 OR 和 AND 运算 符 。 用 . 正 伪 指 令 时 ,符号 上 表示 的 是 
逻辑 OR 运算 符 : 
.IF expressionl || expression2 


statements 
-ENDIF 


同样 ， 符 号 && 表示 的 是 逻辑 AND 运算 符 : 


,IE expression1 && expression2 
statements 
. ENDIF 


下 面 的 程序 示例 中 将 使 用 逻辑 OR 运算 符 。 

1. SetCursorPosition 示例 

下 例 给 出 的 SetCursorPosition 过 程 ， 根 据 两 个 输入 参数 DH 和 DL (参见 SetCurasm )， 
执行 范围 检查 。Y 坐标 (DH) 范围 必须 为 0 一 24。X 坐标 (DL) 范围 必须 为 0 ~ 79。 不论 
发 现 哪个 坐标 超出 范围 ， 都 显示 一 条 错误 消息 : 


SetCursorPosition PROC 
; 设置 光标 位 置 。 
;? 接收 : DL=X 坐标 ，DH=Y 坐标 。 
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; 检查 DL 和 DH 的 范围 
7 返回 : 无 

.data 

BadXCoordMsg BYTE "X-Coordinate out of range!",O0Dh,O0Ah,0 
BadYCoordMsg BYTE "Y-Coordinate out of range!",ODh,O0Ah,0 


D 


.code 
Ip (a1 0) || (tar 5 79) 
mov edx,OFFSET BadxXCoordMsg 
call WriteString 
jmp quit 
. ENDIF 
‘IF (dh < 0) || (ah > 24) 
mov edx,OFFSET BadYCoordMsg 
call Writestring 
jmp quit 
- ENDIF 
call Gotoxy 
quit: 
ret 


SetCursorPosition ENDP 


MASM 对 SetCursorPosition 进行 预 处 理 时 ， 生 成 代码 如 下 : 


.code 
1 IF (dl < 0 || (al $79) 


cmp dl, 000h 
jb  @c0002 
cmp dl, 04Fh 


jbe  Q@c0001 
ec0o002: 


mov edx,OFFSET BadXCoordMsg 
call WriteString 


jmp quit 

; .ENDIF 

@C0001:; 

Rn < O07 | (O29 
cmp dh, 000h 
jb ec0005 


cmp ”dh，018h 
jbe ec0004 


@C0005: 
mov edx,OFFSET BadYCoordMsg 
call WriteString 


jmp quit 
; .ENDIF 
@C0004: 

call Gotoxy 
quit: 

ret 


2. 大 学 注册 示例 

假设 有 一 个 大 学 生 想 要 进行 课程 注册 。 现 在 用 两 个 条 件 来 决定 该 生 是 否 能 注册 : 第 一 个 
条 件 是 学 生 的 平均 成 绩 ， 范 围 为 0 ~ 400， 其 中 400 是 可 能 的 最 高 成 绩 ; 第 二 个 条 件 是 学 生 
期 望 获得 的 学 分 。 可 以 使 用 多 分 支 结 构 ， 包 括 . 正 、.ELSEIF 和 .ENDIF。 示 例 (参见 Regist. 
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asm) 如 下 : 


.data 
TRUE = 1 
FALSE = 0 


gradeAverage WORD 275 ; 要 检查 的 数值 
credits WORD 12 ; 要 检查 的 数值 


OkToRegister BYTE ? 
-code 
mov OkToRegister,FALSE 
,IF gradeAverage > 350 
mov OkToRegister,TRUE 
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.ELSEIF (gradeAverage > 250) && (credits <= 16) 


mov OkToRegister, TRUE 
‘ELSEIF (credits <= 12) 

mov OkToRegister,TRUE 
ENDIF 


汇编 器 生成 的 相应 代码 如 表 6-9 所 示 ， 用 Microsoft Visual Studio 调试 器 的 Dissassembly 
窗口 可 以 查看 该 表 。( 为 了 便于 阅读 ， 已 经 对 其 进行 了 一 些 整理 。) 汇编 程序 时 ， 如 果 使 用 / 
Sg 命令 行 就 可 以 在 源 列 表 文 件 中 显示 MASM 生成 代码 。 被 定义 常量 的 大 小 (如 当前 代码 示 
例 中 的 TRUE 和 FALSE) 为 32 位 。 所 以 ， 把 一 个 常量 送 和 BYTE 类 型 地 址 时 ，MASM 会 


插入 BYTE PTR 运算 符 。 
表 6-9 


jbe 
IIOV 
jmp 
@C0006: 
cmp 
jbe 
cmp 
ja 
mov 
jmp 


cmp 
ja 
mov 
ec0008 : 


byte ptr 
word ptr 
@C0006 
byte ptr 
@C0008 


word ptr 
@C0009 
word ptr 
@C0009 
byte ptr 
@C0008 


word ptr 
@C0008 
byte ptr 





6.7.4 用 .REPEAT 和 .WHILE 创建 循环 


除了 用 CMP 和 条 件 跳 转 指 令 外 ，.REPEAT 和 .WHILE 伪 指令 还 提供 了 另 一 种 方法 来 编 
写 循环 。 它 们 可 以 使 用 之 前 由 表 6-8 列 出 的 条 件 表达 式 。.REPEAT 伪 指 令 执行 循环 体 ， 然 后 
测试 .UNTIL 伪 指 令 后 面 的 运行 时 条 件 : 


.REPEAT 
statements 
‘UNTIL condition 


注册 示例 ，MASM 生成 代码 


OkToRegister ,FALSE 
gradeAverage,350 


OkToRegister, TRUE 


gradeAverage,250 


credits,16 


OkToRegister,TRUE 


credits,12 


OkToRegister, TRUE 


.WHILE 伪 指 令 在 执行 循环 体 之 前 测试 条 件 : 


.WHILE condition 
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statements 
. ENDW 


示例 : 下 述 语句 使 用 .WHILE 伪 指 令 显 示 数 值 1 到 10。 循 环 之 前 ， 计 数 器 寄存 
器 (EAX) 被 初始 化 为 0。 之 后 ， 循 环 体 内 的 第 一 条 语句 将 EAX 加 1。 当 EAX 等 于 10 
时 ，.WHILE 伪 指 令 将 分 支 到 循环 体外 。 


mov eax,0 

-WHILE eax < 10 
inc eax 
call WriteDec 
call Crlf 

.ENDW 


下 述 语句 使 用 .REPEAT 伪 指 令 显示 数值 1 到 10: 


mov eax,0 
.REPEAT 
inc eax 
call WriteDec 
all Crlf 
‘UNTIL eax == 10 


示例 : 含 IF 语句 的 循环 
本 章 前 面 的 6.5.3 节 展 示 了 如 何 编写 汇编 语言 代码 来 实现 WHILE 循环 檬 套 IF 语句 。 伪 
代码 如 下 : 


whilel opl < op2 ) 
Opl++; 
£1{ opl == op3 ) 
Ks 到 区 
else 
X= 3; 
} 


下 面 用 .WHILE 和 .IF 伪 指 令 实 现 这 段 伪 代 码 。 由 于 op1、op2 和 op3 是 变量 ,为 了 避 
免 任何 指令 出 现 两 个 内 存 操作 数 ， 它 们 被 送 入 寄存 器 : 


.data 
xX DWORD 0 
opl DWORD 2 ;被 检测 的 数据 
op2 DWORD 4 ; 被 检测 的 数据 
op3 DWORD 5 ; 被 检测 的 数据 
.code 

mov eax,opl 

mov ebx, op2 

mov ecx,op3 

.WHILE eax < ebx 


‘IF eax == ecx 


6.8 本 章 小 结 
AND、OR、XOR、NOT 和 TEST 指令 被 称 为 按 位 指令 (bitwise instructions)， 因 为 它 


条 件 处 理 183 


们 的 操作 是 位 (bit) 级 的 。 源 操作 数 中 的 每 一 位 都 与 目标 操作 数 的 相同 位 进行 匹配 : 

e 若 两 个 输入 位 都 是 1， 则 AND 指令 结果 为 1。 

e 若 至 少 有 一 个 输入 位 为 1， 则 OR 指令 结果 为 1。 

e 若 两 个 输入 位 不 同 ， 则 XOR 指令 结果 为 1。 

e TEST 指令 对 目的 操作 数 执行 隐 含 的 AND 操作 ， 并 正确 地 设置 标志 位 。 目 的 操作 数 

不 变 。 
e NOT 指令 将 目的 操作 数 的 每 一 位 取 反 。 
CMP 指令 将 目的 操作 数 与 源 操作 数 进行 比较 。 其 隐 舍 操作 为 : 从 目的 操作 数 中 减 去 源 
操作 数 ， 并 且 修 改 相 应 的 CPU 状态 标志 位 。 通 常 ，CMP 后 面 有 一 条 条 件 跳 转 指令 ， 将 程序 
控制 传递 给 一 个 代码 标号 。 
本 章 给 出 了 四 种 类 型 的 条 件 跳 转 指令 : 
e 表 6-2 列 出 了 基于 特定 标志 位 值 的 跳 转 ， 例 如 : JC (有 进位 跳 转 )、JZ (为 零 跳 转 ) 和 
JO (溢出 跳 转 )。 

e 表 6-3 列 出 了 基于 是 否 相 等 的 跳 转 ， 例 如 : 下 (相等 跳 转 )、JNE (不 相等 跳 转 )JECXZ 
(如 果 EXC=0 则 跳 转 ) 和 JRCXZ (如 果 RXC=0 则 跳 转 ) 。 

e 表 6-4 列 出 了 基于 无 符号 数 比 较 的 条 件 跳 转 ， 例 如 : JA( 大 于 则 跳 转 )、JB (小 于 则 跳 
转 ) 和 JAE (大 于 等 于 则 跳 转 ) 。 

e 表 6-5 列 出 了 基于 有 符号 数 比 较 的 跳 转 ， 例 如 : 并 (小 于 则 跳 转 ) 和 JG( 大 于 则 跳 转 )。 

32 位 模式 下 ， 若 零 标志 位 等 于 1， 且 ECX 大 于 零 ， 则 LOOPZ(LOOPE) 指令 重复 循环 。 
若 零 标志 位 等 于 0， 且 ECX 大 于 零 ， 则 LOOPNZ (LOOPNE) 指令 重复 循环 。 在 64 位 模式 
下 ，LOOPZ 和 LOOPNZ 指令 使 用 的 是 RCX 寄存 器 。 

加 密 是 对 数据 进行 编码 处 理 ， 解 密 是 对 数据 进行 解码 处 理 。XOR 指令 可 以 用 于 执行 简 
单 的 加 密 和 解密 。 

流程 图 是 用 视图 展示 程序 逻辑 的 一 种 有 效 工 具 。 利 用 流程 图 作 模型 ， 可 以 很 容易 地 编写 
汇编 语言 代码 。 给 流程 图 中 每 一 个 符号 都 赋予 一 个 标号 ， 并 在 汇编 源 代码 中 使 用 同样 的 标号 
是 很 有 帮助 的 。 

有 限 状 态 机 (FSM) 是 一 种 有 效 工具 ,用 于 验证 包含 可 识别 字符 的 字符 串 ， 比 如 有 符号 
整数 。 如 果 FSM 中 每 个 状态 都 用 标号 表示 ， 那 么 用 汇编 语言 实现 FSM 相对 较 容易 。 

.IFE，.ELSE，.ELSEIF ， 和 .ENDIF 伪 指 令 计算 运行 时 表达 式 ， 并 能 极 大 简化 汇编 语 
言 代 码 。 当 编写 复杂 的 复合 布尔 表达 式 时 ， 它 们 尤为 有 用 。 程 序 员 还 可 以 利用 .WHILE 
和 .REPEAT 伪 指 令 创 建 条 件 循 环 。 


6.9 关键 术语 

6.9.1 术语 

bit-mapped set (位 映射 集 ) compound expression (复合 表达 式 ) 
bit mask〈 位 屏蔽 ) conditional branching (条 件 分 支 ) 
bit vector (位 向 量 ) initial state (初始 状态 ) 

boolean expression (布尔 表达 式 ) key(encryption) ( 密 钥 ) 


cipher text〔( 密 文 ) logical AND operator (逻辑 AND 运算 符 ) 
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logical OR operator (逻辑 OR 运算 符 ) 

masking (bits) (屏蔽 (位 )) 

node (节点 ) 

plain text (明文 ) 

set complement ( 补 集 ) 

conditional control flow directivees (条 件 控 制 流 
伪 指 令 ) 

conditional structure (条 件 结构 ) 

decryption (解密 ) 

directed graph (有 向 图 ) 


6.9.2 指令、 运算 符 和 伪 指令 


AND JRCXZ 
.BREAK JG 
CMP JGE 
.CONTINUR JL 
.ELSE JLE 
.ELSEIF JP 
.ENDIF JS 
.ENDW JZ 

FE JNA 
JA JNAE 
JAE JNB 
JB JNBE 
JBE JNC 
JC JNE 
JE JNG 
JECXZ JNCE 


6.10 复习 题 和 练习 


6.10.1 简 答题 
1. 执行 下 述 指令 后 ，BX 中 的 值 是 多 少 ? 


mov bx, 0FFFFh 
and bx,6Bh 


2. 执行 下 述 指令 后 ，BX 中 的 值 是 多 少 ? 
mov bx,91BAh 
and bx,92h 

3. 执行 下 述 指令 后 ，BX 中 的 值 是 多 少 ? 


mov bx,0649Bh 
wr bx, 3RAh 


井 6 募 


edge ( 边 ) 

encryption (加 密 ) 

finite-state machine(FSM) (有 限 状态 机 ) 
set intersection (交集 ) 

set union (并 集 ) 

short-circuit evaluation (短路 求 值 ) 
symmetric encryption (对 称 加 密 ) 
terminal state (终止 状态 ) 

table-driven selection( 表 驱动 的 选择 ) 
white box testing ( 白 盒 测 试 ) 


LOOPE 
LOOPEN 
LOOPZ 
LOOPNZ 
NOT 

OR 
.REPEAT 
TEST 
.UNTIL 
.UNTILCXZ 
.WHILE 
XOR 
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4, 执行 下 述 指令 后 ，BX 中 的 值 是 多 少 ? 
mov bx,029D6h 
xor bx,8181h 
5. 执行 下 述 指 令 后 ，EBX 中 的 值 是 多 少 ? 
mov ebx,O0AFAF649Bh 
ox ebx, 3A219604h 
6. 执行 下 述 指令 后 ，RBX 中 的 值 是 多 少 ? 
mov rbx,O0AFAF649Bh 
xor rbx,OFFFFFFFFh 
7. 下 述 指令 序列 中 ， 写 出 指定 的 AL 二 进 制 结果 值 : 


mov al,01101111b 
and al,00101101b 
mov al, 6Dh 


and al,4an Rs 
mov al,00001111b 

or al,6lh 六 
mov al,94h 

xer al,37h $ 


8. 下 述 指令 序列 中 ， 写 出 指定 的 AL 十 六 进 制 结果 值 : 


mov al,7Ah 
not al 区 
mov al,3Dh 
and al,74h ws 
mov al,9Bh 
or al,35h :Be 
mov al,72h 
xor ad, 0DCch i d. 


9. 下 述 指令 序列 中 ， 写 出 指定 的 进位 标志 位 、 零 标志 位 和 符号 标志 位 的 值 ; 


mov al,00001111b 


test al,00000010b 7 CE= ZF= SF= 
mov al,00000110b 
cmp al,00000101b ; b. CF= ZF= SF= 
mov al,00000101b 
cmp al,00000111b 1 ZF= SF= 


10. 哪 条 条 件 跳 转 指令 根据 ECX 的 内 容 执 行 分 支 ? 
11. JA 和 JNBE 指令 是 如 何 受到 零 标志 位 和 进位 标志 位 的 影响 的 ? 
12. 执行 下 述 代码 后 ，EDX 的 最 终 值 是 多 少 ? 


mov edx,l1 
mov eax,7FFFh 
cmp eax,8000h 
TT L1 

mov edx,0 


站 [235] 
13. 执行 下 述 代码 后 ，EDX 的 最 终 值 是 多 少 ? 


mov edx,l 
mov eax,7FFFh 
cmp eax,8000h 
jr 
mov edx,0 
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14. 执行 下 述 代码 后 ，EDX 的 最 终 值 是 多 少 ? 


mov edx,l 
mov eax,7FFFh 
cmp eax,OFFFF8000h 
33 L2 
mov edx,0 
L2: 


15. ( 真 / 假 ); 下 述 代码 将 跳 转 到 标号 Target。 


mov eax,-30 
cmp eax,-50 
jg Target 


16. ( 真 / 假 ): 下 述 代码 将 跳 转 到 标号 Target。 


mov eax,-42 
cmp eax,26 
ja Target 


17. 执行 下 列 指令 后 ，RBX 的 值 是 多 少 ? 


mov rbx,OFFFFFFFFFFFFFFFFh 
and rbx,80h 


18. 执行 下 列 指令 后 ，RBX 的 值 是 多 少 ? 


mov rbx,O0FFFFFFFFFFFFFFFFh 
and rbx,808080h 


19. 执行 下 列 指令 后 ，RBX 的 值 是 多 少 ? 


mov rbx,O0FFFFFFFFFFFFFFFFh 
and rbx,80808080h 


6.10.2 算法 基础 


一 


Dp 


A 


\D 


. 编写 一 条 指令 将 AL 中 的 ASCII 数字 转换 为 相应 的 二 进 制 数 。 如 果 AL 包含 的 已 经 是 二 进 制 ( 00h 一 09h)， 则 


不 进行 转换 。 
编写 指令 计算 32 位 内 存 操作 数 的 奇偶 性 。 提 示 : 使 用 本 节 之 前 给 出 的 公式 : B0 XOR B1 XOR B2 XOR B3。 


. 设 有 两 个 位 映射 集 SetX 和 SetY， 编 写 指令 序列 在 EAX 中 生成 一 个 位 串 ， 以 表示 属于 SetX 但 不 属于 SetY 的 


元 素 。 


- 编写 指令 ， 若 DX 中 的 无 符号 数 小 于 等 于 CX 中 的 数 ， 则 跳 转 到 标号 L1。 


编写 指令 ， 若 AX 中 的 有 符号 数 大 于 CX 中 的 数 ， 则 跳 转 到 标号 L2。 


. 编写 指令 ,清除 AL 的 位 0 和 位 1， 若 目的 操作 数 等 于 零 ， 则 代码 跳 转 到 标号 L3; 否则 跳 转 到 标号 L4。 
. 汇编 语言 实现 下 面 的 伪 代 码 。 使 用 短路 求 值 ， 并 假设 vall 和 X 是 32 位 变量 。 


if( vall > ecx ) AND ( ecx > edx ) 


共生 :二 
else 
X= 2; 
.汇编 语言 实现 下 面 的 伪 代 码 。 使 用 短路 求 值 ， 并 假设 X 是 32 位 变量 。 
if( ebx > ecx ) OR ( ebx > vall ) 
X=1 
else 
芭 - 冯 六 


. 汇编 语言 实现 下 面 的 伪 代 码 。 使 用 短路 求 值 ， 并 假设 X 是 32 位 变量 。 
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if( ebx > ecx AND ebx > edx) OR ( edx > eax ) 
> 

else 
区 三 2 


10. 汇编 语言 实现 下 面 的 伪 代 码 。 使 用 短路 求 值 ， 并 假设 A、B 和 NN 是 32 位 有 符号 数 。 
while N>0 
if N!=3 AND (N<AORN > B) 
N=N-2 
else 
N=N-1 
end whle 


6.11 编程 练习 


6.11.1 测试 代码 的 建议 


在 对 本 章 及 后 续 章 节 编程 练习 所 写 代 码 进行 测试 时 ， 本 书 有 如 下 建议 : 

。 第 一 次 测试 程序 时 ， 总 是 用 调试 器 进行 单 步 执行 。 小 细节 是 很 容易 被 遗忘 的 ， 调 试 器 可 以 让 程 
序 员 看 到 实际 发 生 了 什么 。 

e 若 说 明 要 求 使 用 有 符号 数组 ， 需 确保 其 中 包含 一 个 负数 值 。 

。 如 果 指 定 了 输入 数值 的 范围 ， 则 测试 数据 应 包括 大 于 上 界 、 在 界限 中 和 低 于 下 界 的 数值 。 

。 使 用 不 同 长 度 的 数组 ， 创 建 多 个 测试 案例 。 

e 当 编写 的 程序 要 向 数组 进行 写 人 操作 时 ，Visual Studio 调试 器 是 评估 程序 正确 性 的 最 好 工具 。 
使 用 调试 器 的 Memory 窗口 显示 数组 ， 可 以 选择 为 十 六 进 制 或 十 进 制 形式 。 

。 调用 被 测试 过 程 之 后 ， 应 立刻 再 次 调用 该 过 程 以 检查 其 是 否 保存 了 所 有 的 寄存 器 。 示 例如 下 : 


mov esi,OFFSET array 

mov ecx,count 

call CalcSum ;用 EAX 返回 和 数 

call CalcSum ;再 次 调用 ,检查 寄存 器 是 否 已 保存 


一 般 EAX 中 会 有 一 个 返回 值 ， 因 此 ，EAX 当然 是 无 法 保存 的 。 所 以 ， 通 常 不 能 用 EAX 输入 

参数 。 

e 如 果 打 算 向 过 程 传递 多 个 数组 ， 则 应 确保 不 在 过 程 中 引用 数组 名 。 取 而 代 之 ， 在 调用 过 程 
之 前 ,将 数组 偏 移 量 送 入 ESI 或 EDI。 这 就 意味 着 在 过 程 内 应 使 用 间接 寻 址 ( 形 如 [esi] 或 
[edi])。 

e 如 果 需 要 定义 只 用 于 过 程 内 的 变量 ， 可 以 在 变量 的 前 面 使 用 .data 伪 指令 ， 然 后 在 其 后 使 
用 .code 伪 指令 。 示 例如 下 : 

MyCoolProcedure PROC 

.data 

sum SDWORD ? 

.Code 


mov sum,0 
(etc.) 


和 C++ 或 Java 语言 中 的 局 部 变量 不 同 ， 该 变量 仍然 全 局 可 见 。 不 过 ， 既 然 该 变量 是 在 过 程 内 定 
义 的 ， 显 然 不 打算 在 其 他 的 位 置 使 用 。 当 然 ， 必 须 使 用 运行 时 指令 来 初始 化 过 程 内 使 用 变量 ， 因 为 过 
程 将 会 被 调用 多 次 。 再 次 调用 过 程 时 ， 不 会 希望 它 留 有 前 次 调用 的 任何 残留 的 数值 。 
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6.11.2 习题 


*1. 填充 数组 
创建 过 程 ， 用 NN 个 随机 数 填充 一 个 双 字 数组 ， 这 些 数 必须 包含 在 从 j 到 上 的 范围 内 。 调 用 过 程 
时 ， 传 递 的 参数 为 : 保存 数据 的 数组 指针 、N、j 和 大 的 值 。 对 该 过 程 的 多 次 调用 之 间 ， 要 保存 所 有 
的 寄存 器 值 。 编 写 测试 程序 ， 用 不 同 的 j 和 人 上 值 两 次 调用 该 过 程 。 利 用 调试 器 检验 结果 。 
** 2. 指定 范围 内 的 数组 元 素 求 和 
创建 过 程 ， 返 回 从 7 一 上 范围 (包含 ) 内 所 有 数组 元 素 之 和 。 编 写 测 试 程序 调用 该 过 程 两 次 ， 
需 传 递 的 参数 为 : 有 符号 双 字 数组 指针 、 数 组 大 小 、j 和 大 的 值 。 寄 存 器 EAX 返回 和 数 。 调 用 过 程 
之 间 ， 保 存 其 他 所 有 的 寄存 器 。 
*x 3. 计算 考试 得 分 
创建 过 程 CalcGrade， 接 收 0 ~ 100 范 围 内 的 一 个 整数 ， 并 用 AL 寄存 器 返回 一 个 大 写字 母 。 
238 对 该 过 程 的 多 次 调用 之 间 ， 保 存 其 他 所 有 的 寄存 器 。 按 照 如 下 规则 确定 返回 字母 : 





编写 测试 程序 ,在 50 ~ 100 范围 内 生成 10 个 随机 数 。 每 次 生成 一 个 整数 ， 并 将 其 传递 给 
CalcGrade 过 程 。 可 以 使 用 调试 器 测试 程序 ， 另 外 ， 如 果 选 择 使 用 本 书 的 链接 库 ， 也 可 以 显示 每 个 
整数 及 其 对 应 的 等 级 字母 。( 本 程序 要 求 用 Irvine32 链接 库 ， 因 为 它 要 使 用 RandomRange 过 程 。) 
心 4. 大 学 注册 
以 6.7.3 节 的 大 学 注册 示例 为 基础 ， 实 现下 述 功 能 : 
用 CMP 和 条 件 跳 转 指令 重新 编码 (取代 .IF 和 .ELSEIF 伪 指 令 )。 
e 实现 对 学 分 值 的 范围 检查 : 学 分 不 能 小 于 1 也 不 能 大 于 30。 如 果 发 现 无 效 输 入 ， 则 显示 适当 
的 错误 消息 。 
提示 用 户 输入 平均 成 绩 和 学 分 值 。 
e 显示 消息 给 出 评估 结果 ， 如 “The student can register” 或 “The student cannot register” 。 
(本 程序 要 求 使 用 Irvine32 链接 库 。) 
***5. 布尔 计算 器 ( 1) 
创建 程序 ， 其 功能 为 简单 的 32 位 整数 布尔 运算 器 。 显 示 菜 单 提示 用 户 从 下 表 中 选择 
一 项 : 
1.xAND y 
2.XORY 
3.NOT x 
4.xXORy 
5. Exit program (退出 程序 ) 
用 户 做 出 选择 后 ， 调 用 过 程 显示 将 要 执行 操作 的 名 称 。 必 须 用 6.5.4 节 给 出 的 表 驱 动 选择 技术 
实现 该 过 程 。( 习 题 6 将 实现 运算 操作 。)( 本 程序 要 求 使 用 Irvine32 链接 库 。) 
**x 6. 布尔 计算 器 ( 2 ) 
继续 编写 习题 5 的 程序 ， 实 现 如 下 过 程 : 
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e AND_op : 提示 用 户 输入 两 个 十 六 进 制 整数 。 对 其 进行 AND 操作 ， 并 用 十 六 进 制 形式 显示 
结果 。 
e OR_op: 提示 用 户 输入 两 个 十 六 进 制 整数 。 对 其 进行 OR 操作 ， 并 用 十 六 进 制 形式 显示 结果 。 
e NOT_op : 提示 用 户 输入 一 个 十 六 进 制 整 数 。 对 其 进行 NOT 操作 ， 并 用 十 六 进 制 形 式 显示 结 
果 。 
e XOR_op: 提示 用 户 输入 两 个 十 六 进 制 整数 。 对 其 进行 异 或 操作 ， 并 用 十 六 进 制 形式 显示 结果 。 
(本 程序 要 求 使 用 [rvine32 链接 库 。) 
tx 了. 概率 和 颜色 
编写 程序 ， 从 3 种 不 同 的 颜色 中 随机 选择 一 种 用 以 在 屏幕 上 显示 文本 。 通 过 循环 显示 20 行文 
本 ， 每 行 都 随机 选择 一 种 颜色 。 每 种 颜色 出 现 的 概率 为 : 白色 =30%， 蓝 色 =10%， 绿色 =60%。 建 
议 :在 0 一 9 之 间 生 成 一 个 随机 数 。 如 果 该 数 在 0 ~ 2 (包含 ) 之 间 ， 则 选择 白色 ; 如 果 该 数 等 于 3， 
则 选择 蓝 色 ; 如 果 该 数 在 4 一 9 (包含 ) 之 间 ， 则 选择 绿色 。 运 行程 序 10 次 ， 对 其 进行 测试 。 每 次 
运行 时 ， 观 察 文本 行 颜色 的 分 布 是 否 满 足 要 求 的 概率 。( 本 程序 要 求 使 用 Irvine32 链接 库 。) 
*** 8. 消息 加 密 
按 要 求 修改 6.3.4 节 的 加 密 程序 ， 创建 包含 多 个 字符 的 密 钥 。 使 用 该 密 铀 ， 通 过 将 密 钥 与 明文 
相应 位 进行 按 位 XOR 运算 ， 来 对 明文 加 密 和 解密 。 按 需 重复 使 用 密 钥 ， 直 到 明文 中 的 全 部 字 节 都 
转换 完 。 例 如 ， 假 设 密 钥 为 “ABXmv#7”"， 则 密 钥 与 明文 字 节 之 间 的 对 应 如 下 图 所 示 : 


明文 [T]n[iTs| [is Taf Paliatelxz ti mesls|ag|e| 等 等 
密 铀 [A|B|X|mlv|#|l71AlBlxlmlvi#l7[AlB|xlmlv[#l7|Als|xlmlv|t#[l7 
(重复 密 钥 ， 直 到 其 与 明文 等 长 …… ) 
** 9.PIN 验证 


银行 用 个 人 专用 识别 码 ( Personal Identification Number，PIN ) 对 每 个 客户 进行 唯一 标识 。 假 
设 银行 将 用 户 5 位 PIN 中 每 一 位 的 可 接受 数值 都 限定 在 指定 范围 内 ， 下 表 给 出 了 PIN 中 从 左 到 右 
每 一 位 数字 的 可 接受 取 值 范围 。 由 此 可 见 ，PIN 52413 是 有 效 的， 而 PIN 43534 是 无 效 的 ， 因 为 第 
一 个 数字 不 在 指定 范围 内 。 同 样 ， 由 于 最 后 一 个 数字 ，64532 也 是 无 效 的 。 









本 题 任务 是 创建 过 程 Validate_PIN : 接收 一 个 字 节 数组 指针 ， 该 数组 包含 一 个 5 位 的 PIN 值 ; 
定义 两 个 数组 保存 取 值 范围 的 最 小 值 和 最 大 值 ， 并 使 用 这 些 数 值 来 验证 传递 给 过 程 的 PIN 中 的 每 
一 位 数字 。 如 有 任何 一 位 数字 超出 范围 ， 则 立刻 用 EAX 寄存 器 返回 该 数字 的 位 置 (1 一 5 )。 如 果 
整个 PIN 都 是 有 效 的 ， 则 用 EAX 返回 0。 对 该 过 程 的 多 次 调用 之 间 ， 要 保存 其 他 所 有 寄存 器 的 值 。 
编写 测试 程序 ， 使 用 有 效 和 无 效 的 字 节 数组 ， 调 用 Validate_PIN 至 少 四 次 。 在 调试 器 中 运行 测试 程 
序 ， 每 次 调用 过 程 后 .验证 EAX 中 的 返回 值 是 否 有 效 。 另 外 ， 如 果 选 择 用 本 书 的 链接 库 、 也 可 以 
在 每 次 过 程 调用 后 在 控制 台 上 显示 “Valid” 或 “Invalid”。 

**** 10. 奇偶 性 检查 

数据 传输 系统 和 文件 子 系统 通常 依靠 计算 数据 块 的 奇偶 性 ( 偶 校 验 或 奇 校 验 ) 来 进行 错误 检 
测 。 本 题 任务 是 创建 一 个 过 程 ， 如 果 字 节 数 组 为 偶 校 验 ， 则 EAX 返回 True ; 如 果 是 奇 校 验 ， 则 
EAX 返回 False。 换 句 话 说 ， 如 果 计 算 整 个 数组 中 的 所 有 位 ， 则 结果 将 为 偶数 或 奇数 。 对 该 过 程 的 
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多 次 调用 之 间 ， 要 保存 其 他 所 有 寄存 器 的 值 。 编 写 测 试 程序 ， 调 用 该 过 程 两 次 ， 每 次 都 向 其 传递 数 
组 指针 和 数组 长 度 。EAX 中 的 过 程 返回 值 应 为 1 (True) 或 0 (False)。 测 试 数据 ， 需 创建 两 个 至 少 
包括 10 字 节 的 数组 ， 一 个 为 偶 校 验 ， 另 一 个 为 奇 校 验 。 

提示 “本章 前 面 的 内 容 展 示 了 如 何 通过 对 字 节 序列 反复 使 用 XOR 指令 ， 来 确定 其 奇偶 性 。 
因此 ， 建 议 使 用 循环 结构 。 但 要 注意 的 是 ， 由 于 某 些 机 器 指令 会 影响 奇偶 标志 位 ， 而 其 他 指令 不 


会 影响 奇偶 标志 位 (查看 附录 B 中 的 所 有 指令 就 能 发 现 这 一 点 )。 所 以 ， 循 环 结构 中 检查 奇偶 性 的 
代码 应 小 心 保 存 和 恢复 奇偶 标志 位 的 状态 ， 以 避免 程序 代码 无 意 间 修 改 了 该 标志 位 。 
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本 章 将 介绍 汇编 语言 最 大 的 优势 之 一 : 基本 的 二 进 制 移 位 和 循环 移 位 技术 。 实 际 上 ， 位 
操作 是 计算 机 图 形 学 、 数 据 加 密 和 硬件 控制 的 固有 部 分 。 实 现 位 操作 的 指令 是 功能 强大 的 工 
有 具 ,但 是 高 级 语言 只 能 实现 其 中 的 一 部 分 ， 并且 由 于 高 级 语言 要 求 与 平台 无 关 ， 所 以 这 些 指 
令 在 一 定 程度 上 被 弱化 了 。 本 章 将 展示 一 些 对 移 位 操作 的 应 用 ,包括 乘除 法 的 优化 。 

并 非 所 有 的 高 级 编程 语言 都 支持 任意 长 度 整 数 的 运算 。 但 是 汇编 语言 指令 使 得 它 能 够 加 
减 几乎 任何 长 度 的 整数 。 本 章 还 将 介绍 执行 压缩 十 进 制 整数 和 整数 字符 串 运算 的 专用 指令 。 


7.1 移 位 和 循环 移 位 指令 


移 位 指令 与 第 6 章 介绍 的 按 位 操作 指令 一 起 形成 了 汇编 语言 最 显著 的 特点 之 一 。 位 移动 
(bit shifting) 意味 着 在 操作 数 内 向 左 或 向 右 移动 。x86 处 理 器 在 这 方面 提供 了 相当 丰富 的 指 
令 集 ( 表 7-1 )， 这 些 指令 都 会 影响 溢出 标志 位 和 进位 标志 位 。 

表 7-1 移 位 和 循环 移 位 指令 


带 进位 的 循环 左 移 


带 进 位 的 循环 右 移 





7.1.1 逻辑 移 位 和 算术 移 位 


移动 操作 数 的 位 有 两 种 方法 。 第 一 种 是 逻辑 移 位 (logic shift)， 空 出 来 的 位 用 0 填充 。 
如 下 图 所 示 ， 一 个 字 节 的 数据 向 右 移动 一 位 。 也 就 是 说 ， 每 一 位 都 被 移动 到 其 旁边 的 低位 
上 。 注 意 ,， 位 7 被 填充 为 0: 
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下 图 所 示 为 二 进 制 数 1100 1111 逻辑 右 移 一 位 ， 得 到 0110 0111。 最 低位 移入 进位 标 
志 位 : 


1 EE ODAS 条 1 1 一 (cf) 
NS 
一 >0 1 1 0 0 1 1 1 
另 一 种 移 位 的 方法 是 算术 移 位 (arithmetic shift)， 空 出 来 的 位 用 原 数 据 的 符号 位 填充 : 
EE 品 
CF 


例如 ， 二 进 制 数 1100 1111， 符 号 位 为 1。 算 术 右 移 一 位 后 ， 得 到 1110 0111: 
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1 1 0 0 1 1 1 1 一 >(cf) 
XXXu 
a 2, De tt Ph 
7.1.2 ”SHL 指令 


SHL ( 左 移 ) 指令 使 目的 操作 数 逻 辑 左 移 一 位 ， 最 低位 用 0 填充 。 最 高 位 移入 进位 标志 
位 ， 而 进位 标志 位 中 原来 的 数值 被 丢弃 : 


Be \ 
<] 0 
Ns En \ 





EE 
若 将 1100 1111 左 移 1 位 ， 该 数 就 变 为 1001 1110: 


(cf) <—1 1 0 0 | 1 1 1 
Pa 
1 0 0 1 1 1 0<— 
SHL 的 第 一 个 操作 数 是 目的 操作 数 ， 第 二 个 操作 数 是 移 位 次 数 : 


SHL destination,count 


该 指令 可 用 的 操作 数 类 型 如 下 所 示 : 


SHL reg, imm8 
SHL mem, imm8 
SHL reg,cL 
SHL mem,CL 


x86 处 理 器 允许 imm8 为 0 一 255 中 的 任何 整数 。 另 外 ，CL 寄存 器 包含 的 是 移 位 计数 。 
上 述 格式 同样 适用 于 SHR、SAL、SAR、ROR、ROL、RCR 和 RCL 指令 。 
示例 ”下列 指 令 中 ，BL 左 移 一 位 。 最 高 位 复制 到 进位 标志 位 ， 最 低位 填充 0: 


mov bl,8Fh ; BL = 10001111b 
shl bl;l ; CF = 1, BL = 00011110b 


当 一 个 数 多 次 进行 左 移 时 ， 进 位 标志 位 保存 的 是 最 后 移出 最 高 有 效 位 ( MSB) 的 数值 。 
下 例 中 , 位 7 没有 留 在 进位 标志 位 中 ， 因 为 ， 它 被 位 6 (0 ) 替换 了 : 
mov al,10000000b 


shl al,2 ; CF = 0, AL = 00000000b 


同样 ， 当 一 个 数 多 次 进行 右 移 时 ， 进 位 标志 位 保存 的 是 最 后 移出 最 低 有 效 位 (LSB) 的 
数值 。 

位 元 乘法 ”数值 进行 左 移 (向 MSB 移动 ) 即 执行 了 位 元 乘法 (Bitwise Multiplication ) 。 
例如 ，SHL 可 以 通过 2 的 军 进 行 乘法 运算 。 任 何 操作 数 左 移 n 位 ， 即 将 该 数 乘 以 2"。 现 将 
整数 5 左 移 一 位 则 得 到 5 x 2'=10: 


shl dl,1 ;移动 后 [0 0001010]-lo 
若 二 进 制 数 0000 1010 (十 进 制 数 10 ) 左 移 两 位 ， 其 结果 与 10 乘 以 2 相同: 


mov dl,10 ; 移动 前 : 00001010 
shl dl,2 ;移动 后 ; 00101000 
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7.1.3 SHR 指令 


SHR ( 右 移 ) 指令 使 目的 操作 数 逻 辑 右 移 一 位 ， 最 高 位 用 0 填充 。 最 低位 复制 到 进位 标 
志 位 ， 而 进位 标志 位 中 原来 的 数值 被 丢弃 : 


CF 
SHR 与 SHL 的 指令 格式 相同 。 在 下 面 的 例子 中 ，AL 中 的 最 低位 0 被 复制 到 进位 标志 
位 ， 而 AL 中 的 最 高 位 用 0 填充 : 


mov al,0D0h ;AL= 11010000b 
shr al,l ;AL = 01101000b, CF = 0 


在 多 位 移 操作 中 ， 最 后 一 个 移出 位 0 (LSB) 的 数值 进入 进位 标志 位 : 

mov al,00000010b 

shr al,2 ; AL = 00000000b, CF = 1 

位 元 除法 ”数值 进行 右 移 (向 LSB 移动 ) 即 执行 了 位 元 除法 ( Bitwise Division)。 将 一 
个 无 符号 数 右 移 n 位 ， 即 将 该 数 除 以 2"。 下 述 语句 将 32 除 以 2'， 结 果 为 16: 


mov dl,32 ;移动 前 : |00100000|=32 
shr dl,1 ;移动 后 [0 0010000)=16 


下 例 实现 的 是 64 除 以 2 : 
mov al,01000000b ; AL = 64 
ahr al3 ; 除 以 8， AL = 00001000b 


用 移 位 的 方法 实现 有 符号 数 除 法 可 以 使 用 SAR 指令 ， 因 为 该 指令 会 保留 操作 数 的 符 
号 位 。 


7.1.4 SAL 和 SAR 指令 


SAL (算术 左 移 ) 指令 的 操作 与 SHL 指令 一 样 。 每 次 移动 时 ，SAL 都 将 目的 操作 数 中 
的 每 一 位 移动 到 下 一 个 最 高 位 上 。 最 低位 用 0 填充 ; 最 高 位 移入 进位 标志 位 ， 该 标志 位 原来 
的 值 被 丢弃 : 





如 ， 二 进 制 数 1100 1111 算术 左 移 一 位 ， 得 到 1001 1110: 


人 
REWER 
0 
SAR (算术 右 移 ) 指令 将 目的 操作 数 进行 算术 右 移 : 
有 三 于 二 夺 二 
CF 


SAL 与 SAR 指令 的 操作 数 类 型 与 SHL 和 SHR 指令 完全 相同 。 移 位 可 以 重复 执行 ， 其 
次 数 由 第 二 个 操作 数 给 出 的 计数 器 决定 : 
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SAR destination,count 


下 面 的 例子 展示 了 SAR 是 如 何 复制 符号 位 的 。 执 行 指令 前 AL 的 符号 位 为 负 ， 执 行 指 
令 后 该 位 移动 到 右边 的 位 上 : 

mov al,0F0h ; AL = 11110000b (-16) 

sar al,l ; AL = 11111000b (-8), CF = 0 

有 符号 数 除法 使 用 SAR 指令 ， 就 可 以 将 有 符号 操作 数 除 以 2 的 寡 。 下 例 执行 的 
是 -128 除 以 2， 商 为 -16: 


mov dl,-128 ; DL = 10000000b 
sar dl,3 ; DL = 11110000b 


AX 符号 扩展 到 EAX 设 AX 中 为 有 符号 数 ， 现 将 其 符号 位 扩展 到 EAX。 首 先 把 EAX 
左 移 16 位 ， 再 将 其 算术 右 移 16 位 : 


mov ax -128 ; EAX = ?3???FF80h 

shl eax,16 ; EAX = FF800000h 

sar eax,16 ; EAX = FFFFFF80h 
7.1.5 ROL 指令 


以 循环 方式 来 移 位 即 为 位 元 循环 (Bitwise Rotation)。 一些 操作 中 ， 从 数 的 一 端 移出 的 
位 立即 复制 到 该 数 的 男 一 端 。 还 有 一 种 类 型 则 是 把 进位 标志 位 当 作 移动 位 的 中 间 点 。 
ROL (循环 左 移 ) 指令 把 所 有 位 都 向 左 移 。 最 高 位 复制 到 进位 标志 位 和 最 低位 。 该 指令 


格式 与 SHL 指令 相同 : 
TE 


位 循环 不 会 丢弃 位 。 从 数 的 一 端 循 环 出 去 的 位 会 出 现在 该 数 的 男 一 端 。 在 下 例 中 ， 请 注 
意 最 高 位 是 如 何 复制 到 进位 标志 位 和 位 0 的 : 


mov al,40h ; AL = 01000000b 

Ol B11 ; AL = 10000000b, CF = 0 

FO all ; AL = 00000001lb, CF = 1 
= 0 


于 加 二 二 ; AL = 00000010b, CF 


循环 多 次 ” 当 循 环 计 数值 大 于 1 时 ， 进 位 标志 位 保存 的 是 最 后 循环 移出 MSB 的 位 : 


mov al,00100000b 
Bol Biya ;CF= 1, AL = 00000001b 


位 组 交换 利用 ROL 可 以 交换 一 个 字 节 的 高 四 位 (位 4 一 7) 和 低 四 位 (位 0 一 3)。 
例如 ，26h 向 任何 方向 循环 移动 4 位 就 变 为 62h: 

mov al,26h 

rol al,4 ; ML = 62h 

当 多 字 节 整数 以 四 位 为 单位 进行 循环 移 位 时 ， 其 效果 相当 于 一 次 向 右 或 向 左 移动 一 个 
十 六 进 制 位 。 例 如 ,将 6A4Bh 反复 循环 左 移 四 位 ， 最 后 就 会 回 到 初始 值 : 


mov ax,6A4Bh 
rol ax,4 ; AX = A4B6h 
ZOL -axr4 ; AX = 4B6RAh 
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rol ax,4 ; AX = B6R4h 
rol ax,4 ; AX = 6A4Bh 


7.1.6 ”ROR 指令 


ROR (循环 右 移 ) 指令 把 所 有 位 都 向 右 移 ， 最 低位 复制 到 进位 标志 位 和 最 高 位 。 该 指令 
格式 与 SHL 指令 相同 : 





在 下 例 中 ,请 注意 最 低位 是 如 何 复制 到 进位 标志 位 和 结果 的 最 高 位 的 : 

mov al,0lh ; AL = 00000001b 

ror all ; AL = 10000000b, CF = 1 

XGO ,1 ; AL = 01000000b, CF = 0 

循环 多 次 ” 当 循 环 计数 值 大 于 1 时 ， 进 位 标志 位 保存 的 是 最 后 循环 移出 LSB 的 位 : 
mov al,00000100b 

ror al3 7 AL = 10000000b, CF = 1 


7.1.7 RCL 和 RCR 指令 


RCL ( 带 进位 循环 左 移 ) 指令 把 每 一 位 都 向 左 移 ， 进 位 标志 位 复制 到 LSB， 而 MSB 复 
制 到 进位 标志 人 





如 果 把 进位 标志 位 当 作 操作 数 最 高 位 的 附加 位 ， 那 么 RCL 就 成 了 循环 左 移 操作 。 下 面 
的 例子 中 ，CLC 指令 清除 进位 标志 位 。 第 一 条 RCL 指令 将 BL 最 高 位 移 人 进位 标志 位 ， 其 
他 位 都 向 左 移 一 位 。 第 二 条 RCL 指令 将 进位 标志 位 移 人 最 低位 ， 其 他 位 都 向 左 移 一 位 : 


GLe 2 :CF -= 0 

mov bl,88h ; CF,BL = 0 10001000b 
Bel Bl ; CF,BL = 1 00010000b 
rel bl,1 ; CF,BL = 0 00100001b 


从 进位 标志 位 恢复 位 RCL 可 以 恢复 之 前 移 人 进位 标志 位 的 位 。 下 面 的 例子 把 testval 
的 最 低位 移入 进位 标志 位 ， 并 对 其 进行 检查 。 如 果 testval 的 最 低位 为 1， 则 程序 跳 转 ;如 果 
最 低位 为 0， 则 用 RCL 将 该 数 恢复 为 初始 值 : 


.data 

testval BYTE 01101010b 

.Code 

shr testval,l ;将 LSB 移入 进位 标志 位 


jc exit ; 如 果 该 标志 位 置 1， 则 退出 
rcl testval,1 ; 否则 恢复 该 数 原 值 


RCR 指令 ”RCR ( 带 进位 循环 右 移 ) 指令 把 每 一 位 都 向 右 移 ， 进 位 标志 位 复制 到 MSB， 
而 LSB 复制 到 进位 标志 位 : 
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EE 


从 上 图 来 看 ，RCL 指令 将 该 整数 转化 成 了 一 个 9 位 值 ， 进 位 标志 位 位 于 LSB 的 右边 。 
下 面 的 示例 代码 用 STC 将 进位 标志 位 置 1， 然 后 ， 对 AH 寄存 器 执行 一 次 带 进位 循环 右 
移 操作 : 


stc Cw 
mov ah,10h ; AH, CF = 00010000 1 
rer Al ; AH, CF = 10001000 0 


7.1.8 有 符号 数 浇 出 


如 果 有 符号 数 循环 移动 一 位 生成 的 结果 超过 了 目的 操作 数 的 有 符号 数 范围 ， 则 溢出 标志 
位 置 1。 换 句 话说， 即 该 数 的 符号 位 取 反 。 下 例 中 ，8 位 寄存 器 中 的 正 数 ( +127 ) 循环 左 移 
后 变 为 负数 〔(-2 ): 


mov al,+127 ; AL = 01111111b 

rol al,l ; OF = 1, AL = 11111110b 

同样 ，-128 向 右 移动 一 位 ， 溢 出 标志 位 置 1。AL 中 的 结果 (+64 ) 符号 位 与 原 数 相反 : 
mov al,-128 ; AL = 10000000b 

shr al,l ; OF = 1, AL = 01000000b 


如 果 循 环 移动 次 数 大 于 1， 则 溢出 标志 位 无 定义 。 
7.1.9 ”SHLD/SHRD 指令 


SHLD( 双 精度 左 移 ) 指令 将 目的 操作 数 向 左 移动 指定 位 数 。 移 动 形成 的 空位 由 源 操作 
数 的 高 位 填充 。 源 操作 数 不 变 ， 但 是 符号 标志 位 、 零 标志 位 、 辅 助 进 位 标志 位 、 奇 偶 标 志 位 
和 进位 标志 位 会 受 影响 : 


SHLD dest, source, count 


下 图 展示 的 是 SHLD 执行 移动 一 位 的 过 程 。 源 操作 数 的 最 高 位 复制 到 目的 操作 数 的 最 低 
位 上 。 目 的 操作 数 的 所 有 位 都 向 左 移动 : 


目的 操作 数 源 操作 数 





SHRD( 双 精度 右 移 ) 指令 将 目的 操作 数 向 右 移动 指定 位 数 。 移 动 形成 的 空位 由 源 操作 
数 的 低位 填充 : 


SHRD Gest, source, counct 


下 图 展示 的 是 SHRD 执行 移动 一 位 的 过 程 : 
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目 DDD Tol 
下 面 的 指令 格式 既 可 以 应 用 于 SHLD 也 可 以 应 用 于 SHRD。 目 标 操作 数 可 以 是 寄存 器 或 
内 存 操作 数 ; 源 操 作 数 必须 是 寄存 器 ; 移 位 次 数 可 以 是 CL 寄存 器 或 者 8 位 立即 数 : 
SHLD regl16,reg16,Cl/imm8 
SHLD memi6,regi6,CL/imm8 


SHLD reg32,reg32,CL/imm8 
SHLD mem32,reg32,CL/imm8 


示例 1 下 述 语句 将 wval 左 移 4 位 ， 并 把 AX 的 高 4 位 插入 wval 的 低 4 位 : 


.data 

wval WORD 9BA6h 

,Code 

mov ax,0AC36h 

shld wval,ax,4 ; wval = BA6Ah 


数据 移动 过 程 如 下 图 所 示 : 





示例 2 下 例 中 ，AX 右 移 4 位 ，DX 的 低 4 


mov ax,234Bh 
mov dx,7654n 
shrd ax,dx,4 
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为 了 在 屏幕 上 重 定位 图 像 而 必须 将 位 元 组 左右 移动 时 ， 可 以 用 SHLD 和 SHRD 来 处 理 
位 映射 图 像 。 另 一 种 可 能 的 应 用 是 数据 加 密 ， 如 果 加 密 算法 中 包含 位 的 移动 的 话 。 最 后 ， 对 
于 很 长 的 整数 来 说 ， 这 两 条 指令 还 可 以 用 于 快速 执行 其 乘除 法 。 

下 面 的 代码 示例 展示 了 用 SHRD 如 何 将 一 个 双 字 数组 右 移 4 位 : 


-data 
array DWORD 648B2165h,8C943A29h,6DFA4B86h,91F76C04h, 8BAF9857h 


.Code 
mov bl,4 ; 移 位 次 数 
mov esi,OFFSET array ; 数组 的 偏 移 量 
mov ecx, (LENGTHOF array) 一 1 ; 数组 元 素 个 数 
Ll: push ecx ; 保存 循环 计数 
mov eax, [esi + TYPE DWORD] 
mov cl,bl 7 移动 次 数 
shrd [esil],eax,cl ;EAX 移入 [ESI] 的 高 位 


add esi,TYPE DWORD ; 指向 下 一 对 双 字 
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pop ecx 7 恢复 循环 计数 

loop Ll1 

shr DWORD BTR [esi],4 ; 最 后 一 个 双 字 进行 移 位 
7.1.10 ”本 节 回 顾 


1. 哪 条 指令 将 操作 数 的 每 一 位 都 进行 左 移 ， 并 把 最 高 位 复制 到 进位 标志 位 和 最 低位 ? 

2. 哪 条 指令 将 操作 数 的 每 一 位 都 进行 右 移 ， 并 把 最 低位 复制 到 进位 标志 位 ， 而 进位 标志 位 复 
制 到 最 高 位 ? 

3. 哪 条 指令 执行 如 下 操作 (CF 为 进位 标志 位 ) ? 
执行 前 : CF,AL = 1 11010101 
执行 后 : CF,AL = 1 10101011 

4. 执行 指令 SHR AX, 1 时 ， 进 位 标志 位 发 生 了 怎样 的 变化 ? 

5. 挑战 :编写 一 组 指令 ， 不 使 用 SHRD 指令 ， 将 AX 的 最 低位 移入 BX 的 最 高 位 。 然 后 ， 使 
用 SHRD 指令 实现 相同 的 操作 。 

6. 挑战 : 计算 EAX 中 32 位 数 奇偶 性 的 方法 之 一 是 利用 循环 把 该 数 的 每 一 位 都 移入 进位 标 
志 位 ， 然 后 计算 进位 标志 位 置 1 的 次 数 。 编 写 代码 实现 上 述 功能 ， 并 根据 结果 设置 奇偶 标 
志 位 。 


7.2 ” 移 位 和 循环 移 位 的 应 用 


当 程 序 需要 将 一 个 数 的 位 从 一 部 分 移动 到 另 一 部 分 时 ， 汇 编 语言 是 非常 合适 的 工具 。 有 
时 ， 把 数 的 位 元 子 集 移 动 到 位 0， 便 于 分 离 这 些 位 的 值 。 本 节 将 展示 一 些 易于 实现 的 常见 移 
位 和 循环 移 位 的 应 用 。 更 多 应 用 参见 本 章 习题 。 


7.2.1 多 个 双 字 的 移 位 


对 于 已 经 被 分 割 为 字 节 、 字 或 双 字 数组 的 扩展 精度 整数 可 以 进行 移 位 操作 。 在 此 之 前 ， 
必须 知道 该 数组 元 素 是 如 何 存放 的 。 保 存 整数 的 常见 方法 之 一 被 称 为 小 端 顺序 〈little-endian 
order)。 其 工作 方式 如 下 : 将 数组 的 最 低 字 节 存放 到 它 的 起 始 地 址 ， 然 后 ， 从 该 字 节 开始 依 
序 把 高 字 节 存放 到 下 一 个 顺序 的 内 存 地 址 中 。 除 了 可 以 将 数组 作为 字 节 序列 存放 外 ， 还 可 以 
将 其 作为 字 序列 和 双 字 序列 存放 。 如 果 是 后 两 种 形式 ， 则 字 节 和 字 节 之 间 仍 然 是 小 端 顺序 ， 
因为 x86 机 器 是 按照 小 端 顺序 存放 字 和 双 字 的 。 

下 面 的 步骤 说 明了 怎样 将 一 个 字 节 数组 右 移 一 位 。 

步骤 1: 把 位 于 [ESI+2] 的 最 高 字 节 右 移 一 位 ， 其 最 低位 自动 复制 到 进位 标志 位 。 

Ti | 


[esi+2] 


sw1: [oon | > 


步骤 2 : 把 [ESI+1] 循环 右 移 一 位 ， 即 用 进位 标志 位 填充 最 高 位 ， 而 将 最 低位 移 人 进位 
标志 位 : 
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[esi+2] CF [esi+1] 


| 10011001 | ->| loollool | 
CF [esi+1] CF 


>onoor 二 > 


步骤 3 : 把 [ESJ] 循环 右 移 一 位 ， 即 用 进位 标志 位 填充 最 高 位 ， 而 将 最 低位 移 人 进位 标 
志 位 : 


四 [esit+1] [esi+1] 
步骤 3:| 10011001 | | 10011001 | 本 | 10011001 | 门 


CF [esi+1] CF 
EE 加 
步骤 3 完成 后 ， 所 有 的 位 都 向 右 移 动 了 一 位 : 


[esi+2] esi+]1] [esi] 
下 面 的 代码 节选 自 Multishift.asm 程序 ， 实 现 的 是 上 述 3 个 步 又: 


data 
ArraySize = 3 
array BYTE ArraySize DUP(99h) ; 每 个 半 字 节 的 值 都 是 1001 


,Code 
main PROC 
mov esi,0 
shr array[esi+2],1 ; 高 字 节 
rcr array[esi+1],1 ; 中 间 字 节 ， 包 括 进 位 标志 位 
rcr array[lesil],l ; 低 字 节 ， 包 括 进位 标志 位 


虽然 这 个 例子 只 有 3 个 字 节 进行 了 移 位 ， 但 是 它 能 很 容易 被 修改 成 执行 字数 组 或 双 字数 
组 的 移 位 操作 。 利 用 循环 ， 可 以 对 任意 大 小 的 数组 进行 移 位 操作 。 


7.2.2 二进制 乘法 


有 时 程序 员 会 压榨 出 任何 可 以 获得 的 性 能 优势 ， 他 们 会 使 用 移 位 而 非 MUL 指令 来 实现 
整数 乘法 。 当 乘 数 是 2 的 寡 时 ，SHL 指令 执行 的 是 无 符号 数 乘法 。 一 个 无 符号 数 左 移 n 位 就 
是 将 其 乘 以 2"。 其 他 任何 乘 数 都 可 以 表示 为 2 的 寡 之 和 。 例 如 ， 若 将 EAX 中 的 无 符号 数 乘 
以 36， 则 可 以 将 36 写 为 2+2*， 再 使 用 乘法 分 配 律 : 


EAX * 36 = EAX * (25 + 22) 
= EAX * (32 + 4) 
= (EAX * 32) + (EAX * 4) 


下 图 展示 了 乘法 123*36 得 到 结果 4428 的 过 程 : 
01111011 123 


区 100 36 
01111011 123 SHL2 
+ O101] 一 123SHL5 


0001000101001100 4428 


请 注意 这 里 有 个 有 趣 的 现象 ， 乘 数 (36 ) 的 位 2 和 位 5 都 为 1， 而 整数 2 和 5 又 是 需要 
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移 位 的 次 数 。 利 用 这 个 现象 ， 下 面 的 代码 片段 使 用 SHL 和 ADD 指令 实现 了 123 乘 以 36: 


mov eax,123 

mov ebx,eax 

shl eax,5  /; 乘 以 25 
shl ebx,2 ，; 乘 以 2? 
add eax,ebx ; 乘积 相 加 


作为 本 章 的 编程 练习 ， 要 求 读者 把 上 例 一 般 化 ， 并 编写 一 个 过 程 ， 用 移 位 和 加 法 计算 任 
意 两 个 32 位 无 符号 整数 的 乘法 。 


7.2.3 显示 二 进 制 位 


将 二 进 制 整数 转换 为 ASCII 码 的 位 串 ， 并 显示 出 来 是 一 种 常见 的 编程 任务 。SHL 指令 
适用 于 这 个 要 求 ， 因 为 每 次 操作 数 左 移 时 ， 它 都 会 把 操作 数 的 最 高 位 复制 到 进位 标志 位 。 下 
面 的 BinToAsc 过 程 是 该 功能 一 个 简单 的 实现 : 


-一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -一 -一 ~ 一 ~ 一 -一 ~-------~--- 一 一 一 


BinToAsc PROC 


; 将 32 位 二 进 制 整数 转换 为 ASCII 码 的 二 进 制 形式 。 
;接收 :EAX= 二 进 制 整 数 ，ESI 为 缓冲 区 指针 
ee 包含 ASCII 码 二 进 制 数字 的 缓冲 区 


push ecx 
push esi 
mov ecx,32 ; EAX 中 的 位 数 
Ll: shl eax,l ; 最 高 位 移入 进位 标志 位 
mov BYTE PTR [esi],'0' ;选择 0 作为 默认 数字 
jnc 1L2 ; 如 果 进 位 标志 位 为 0， 则 跳 转 到 L2 
mov BYTE PTR [esi],'1' ;和 否则 将 1 送 入 缓冲 区 
L2: ine esi ; 指向 下 一 个 缓冲 区 位 置 
loop Ll1 ; 下 一 位 进行 左 移 
pop esi 
pop ecx 
ret 


BinToAsc ENDP 


7.2.4 提取 文件 日 期 字段 


当 存储 空间 非常 宝贵 的 时 候 ， 系 统 软 件 常常 将 多 个 数据 字段 打包 为 一 个 整数 。 要 获得 
这 些 数据 ， 应 用 程序 就 需要 提取 被 称 为 位 串 (bit string) 的 位 序列 。 例 如 ， 在 实地 址 模式 下 ， 
MS-DOS 函数 57h 用 DX 返回 文件 的 日 期 戳 。( 日 期 戳 显 示 的 是 该 文件 最 后 被 修改 的 日 期 。) 
其 中 , 位 0 一 位 4 表示 的 是 1 一 31 内 的 日 期 ; 位 5 一 位 8 表示 的 是 月 份 ; 位 9 一 位 15 表示 
的 是 年 份 。 如 果 一 个 文件 最 后 被 修改 的 日 期 是 1999 年 3 月 10 日， 则 DX 寄存 器 中 该 文件 的 
日 期 戳 就 如 下 图 所 示 (年 份 以 1980 为 基点 ): 


DH DL 


0 1 1 TO 
| Sa | ee 
字段 : 年 月 日 
位 编号 : 9 一 15 5 一 8 0 一 4 


要 提取 一 个 位 串 ， 就 把 这 些 位 移 到 寄存 器 的 低位 部 分 ， 再 清除 掉 其 他 无 关 的 位 。 下 面 的 
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代码 示例 从 一 个 日 期 稚 中 提取 日 期 字段 ， 方 法 是 : 复制 DL， 然 后 屏蔽 与 该 字段 无 关 的 位 : 
mov al,dl ; 复制 DL 
and al,00011111b ; 清除 位 5 一 位 7 
mov day,al ; 结果 存 入 变量 day 


要 提取 月 份 字 段 ， 就 把 位 5 一 位 8 移 到 AL 的 低位 部 分 ， 再 清除 其 他 无 关 位 ， 最 后 把 
AL 复制 到 变量 中 : 


mov ax,dx ; 复制 DX 

shr ax,5 ? 右 移 5 位 

and al;，00001111b ; 清除 位 4 一 位 了 
mov month,al ; 结果 存 入 变量 month 


年 份 字段 (位 9 一 位 15 ) 完全 包含 在 DH 寄存 器 中 ， 将 其 复制 到 AL， 再 右 移 1 位 : 


mov al, dh ; 复制 DH 
shr al,l ;? 右 移 1 位 
mov ah,0 ;将 AH 清 零 


add ax,1980 ;年 份 基点 为 1980 
movV year,ax ; 结果 存 入 变量 year 


7.2.5 ”本 节 回 顾 


1. 编写 汇编 语言 指令 ， 用 二 进 制 乘法 计算 EAX*24。 

2. 编写 汇编 语言 指令 ， 用 二 进 制 乘法 计算 EAX*21。 提 示 : 21=2?+2?+2?。 

3. 车 用 7.2.3 节 的 BinToAsc 过 程 反 向 显示 二 进 制 位 ， 应 怎样 修改 该 过 程 ? 

4. 文件 目录 项 的 时 间 惟 字段 结构 为 : 位 0 一 位 4 为 秒 , 位 5 一 位 10 为 分 钟 ,位 11 一 位 15 
为 小 时 。 编 写 指令 序列 ， 提 取 分 钟 字段 ， 并 将 值 复制 到 字 节 变量 bMinutes 中 。 


7.3 ”乘法 和 除法 指令 


32 位 模式 下 ， 整 数 乘法 可 以 实现 32 位 、16 位 或 8 位 的 操作 。64 位 模式 下 ， 还 可 以 使 
用 64 位 操作 数 。MUL 和 IMUL 指令 分 别 执行 无 符号 数 和 有 符号 数 乘法 。DIV 指令 执行 无 符 
号 数 除法 ，IDIV 指令 执行 有 符号 数 除 法 。 


7.3.1 MUL 指令 


32 位 模式 下 ，MUL (无 符号 数 乘 法 ) 指令 有 三 种 类 型 : 第 一 种 执行 8 位 操作 数 与 AL 
寄存 器 的 乘法 ; 第 二 种 执行 16 位 操作 数 与 AX 寄存 器 的 乘法 ; 第 三 种 执行 32 位 操作 数 与 
EAX 寄存 器 的 乘法 。 乘 数 和 被 乘 数 的 大 小 必须 保持 一 致 ， 乘 积 的 大 小 则 是 它们 的 一 倍 。 这 
三 种 类 型 都 可 以 使 用 寄存 器 和 内 存 操作 数 ， 但 不 能 使 用 立即 数 : 


MUL reg/mem8 
MUL reg/meml6 
MUL reg/mem32 


MUL 指令 中 的 单 操作 数 是 乘 数 。 表 7-2 按照 乘 数 的 表 7-2 ”MUL 操作 数 
大 小 ， 列 出 了 默认 的 被 乘 数 和 乘积 。 由 于 目的 操作 数 是 被 


乘 数 和 乘 数 大 小 的 两 倍 ， 因 此 不 会 发 生 溢出 。 如 果 乘 积 的 
高 半 部 分 不 为 零 ， 则 MUL 会 把 进位 标志 位 和 溢出 标志 位 
置 1。 因 为 进位 标志 位 常常 用 于 无 符号 数 的 算术 运算 ， 在 





254 


202 多 7 介 


此 我 们 也 主要 说 明 这 种 情况 。 例 如 ， 当 AX 乘 以 一 个 16 位 操作 数 时 ， 乘 积存 放 在 DX 和 AX 
寄存 器 对 中 。 其 中 ， 乘 积 的 高 16 位 存放 在 DX， 低 16 位 存放 在 AX。 如 果 DX 不 等 于 零 ， 
则 进位 标志 位 置 1， 这 就 意味 着 隐 含 的 目的 操作 数 的 低 半 部 分 容纳 不 了 整个 乘积 。 


有 个 很 好 的 理由 要 求 在 执行 MUL 后 检查 进位 标志 位 ， 即 ， 确 认 忽略 乘积 的 高 半 部 





分 是 否 安全 。 
1. MUL 示例 
下 述 语句 实现 AL 乘 以 BL， 乘 积存 放 在 AX 中 。 由 于 AH (乘积 的 高 半 部 分 ) 等 于 零 ， 
因此 进位 标志 位 被 清除 (CF=0 ): 


mov al,5h 
mov bl,10h 
mul bl ; AX = 0050h, CF = 0 


下 图 展示 了 寄存 器 内 容 的 变化 : 


AL BL AX CF 
x [10 | 一 >[ooso] © 
下 述 语句 实现 16 位 值 2000h 乘 以 0100h。 由 于 乘积 的 高 半 部 分 (存放 于 DX) 不 等 于 
零 ， 因 此 进位 标志 位 被 置 1: 


data 
vall WORD 2000h 
val2 WORD 0100h 


.Code 
mov ax,vall ; AX = 2000h 
mul val2 ; DX:AX = 00200000h, CF = 1 


AX BX BE， A CP 
x 
下 述 语句 实现 12345h 乘 以 1000h， 产 生 的 64 位 乘积 存放 在 EDX 和 EAX 寄存 器 对 中 。 
EDX 中 存放 的 乘积 高 半 部 分 为 零 ， 因 此 进位 标志 位 被 清除 : 


mov eax,12345h 
mov ebx,1000h 
mul ebx ; EDX:EAX = 0000000012345000h, CF = 0 


下 图 展示 了 寄存 器 内 容 的 变化 : 


EAX EBX EDX EAX CF 
emt] 。 Gao —» [oooonT 2400] 


2. 在 64 位 模式 下 使 用 MUL 

64 位 模式 下 ，MUL 指令 可 以 使 用 64 位 操作 数 。 一 个 64 位 寄存 器 或 内 存 操作 数 与 
RAX 相 乘 ， 产 生 的 128 位 乘积 存放 到 RDX : RAX 寄存 器 中 。 下 例 中 ，RAX 乘 以 2， 就 
是 将 RAX 中 的 每 一 位 都 左 移 一 位 。RAX 的 最 高 位 溢出 到 RDX 寄存 器 ， 使 得 RDX 的 值 为 
0000 0000 0000 0001h: 


mov rax,0FFFF0000FFFF0000h 
mov rbx,2 
mul rbx ; RDX:RRAX = 0000000000000001FFFE0001FFFE0000 


党 数 运 个 203 


下 面 的 例子 中 ，RAX 乘 以 一 个 64 位 内 存 操作 数 。 该 寄存 器 的 值 乘 以 16， 因 此 ， 其 中 的 
每 个 十 六 进 制 数 字 都 左 移 一 位 (一 次 移动 4 个 二 进 制 位 就 相当 于 乘 以 16 )。 


data 

multiplier QWORD 1l0h 

.Code 

mov rax,0AABBBBCCCCDDDDh 

mul multiplier ; RDX:RAX = 00000000000000000AABBBBCCCCDDDDOh 


7.3.2 1IMUL 指令 


IMUL (有 符号 数 乘法 ) 指令 执行 有 符号 整数 乘法 。 与 MUL 指令 不 同 ，IMUL 会 保留 乘 
积 的 符号 ， 实 现 的 方法 是 ， 将 乘积 低 半 部 分 的 最 高 位 符号 扩展 到 高 半 部 分 。x86 指令 集 支 持 
三 种 格式 的 IMUL 指令 : 单 操作 数 、 双 操作 数 和 三 操作 数 。 单 操作 数 格式 中 ， 乘 数 和 被 乘 数 
大 小 相同 ， 而 乘积 的 大 小 是 它们 的 两 倍 。 

单 操作 数 格式 单 操 作 数 格式 将 乘积 存放 在 AX、DX: AX 或 EDX: EAX 中 : 


IMUL reg/mem8 ; AX = AL * reg/mem8 
IMUL reg/memlé ; DX:AX = AX * reg/meml6 
IMUL reg/mem32 ; EDX:EAX = EAX * reg/mem32 


和 MUL 指令 一 样 ， 其 乘积 的 存储 大 小 使 得 滋 出 不 会 发 生 。 同 时 ， 如 果 乘 积 的 高 半 部 分 
不 是 其 低 半 部 分 的 符号 扩展 ， 则 进位 标志 位 和 溢出 标志 位 置 1。 利 用 这 个 特点 可 以 决定 是 否 
忽略 乘积 的 高 半 部 分 。 

双 操 作 数 格式 ( 32 位 模式 ) 32 位 模式 中 的 双 操 作 数 IMUL 指令 把 乘积 存放 在 第 一 个 操 
作 数 中 ， 这 个 操作 数 必须 是 寄存 器 。 第 二 个 操作 数 ( 乘 数 ) 可 以 是 寄存 器 、 内 存 操作 数 和 立 
即 数 。16 位 格式 如 下 所 示 : 


IMUL regli6é,reg/memié 
IMUL regl16,imm8 
IMUL regl16, immi6 


32 位 操作 数 类 型 如 下 所 示 ， 乘 数 可 以 是 32 位 寄存 器 、32 位 内 存 操作 数 或 立即 数 (8 位 
或 32 位 ): 


IMUL reg32,reg/mem32 
IMUL reg32, imm8 
IMUL reg32, imm32 


双 操 作 数 格式 会 按照 目的 操作 数 的 大 小 来 截取 乘积 。 如 果 被 丢弃 的 是 有 效 位 ， 则 溢出 标 
志 位 和 进位 标志 位 置 1。 因 此 ， 在 执行 了 有 两 个 操作 数 的 IMUL 操作 后 ， 必 须 检 查 这 些 标志 
位 中 的 一 个 。 

三 操作 数 格式 ”32 位 模式 下 的 三 操作 数 格式 将 乘积 保存 在 第 一 个 操作 数 中 。 第 二 个 操 
作 数 可 以 是 16 位 寄存 器 或 内 存 操作 数 ， 它 与 第 三 个 操作 数 相 乘 ， 该 操作 数 是 一 个 8 位 或 16 
位 立即 数 : 

IMUL reglé,reg/memié,imm8 

IMUL regl16,reg/memlé6,immilé6 

而 32 位 寄存 器 或 内 存 操作 数 可 以 与 8 位 或 32 位 立即 数 相 乘 


IMUL reg32,reg/mem32,1imm8 
IMUL reg32, reg/mem32,imm32 
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IMUL 执行 时 ， 若 乘积 有 效 位 被 丢弃 ， 则 溢出 标志 位 和 进位 标志 位 置 1。 因 此 ， 在 执行 
了 有 三 个 操作 数 的 IMUL 操作 后 ， 必 须 检查 这 些 标志 位 中 的 一 个 。 

1. 在 64 位 模式 下 执行 IMUL 

在 64 位 模式 下 ，IMUL 指令 可 以 使 用 64 位 操作 数 。 在 单 操作 数 格式 中 ，64 位 寄存 器 或 
内 存 操作 数 与 RAX 相 乘 ， 产 生 一 个 128 位 且 符 号 扩展 的 乘积 存放 到 RDX : RAX 寄存 器 中 。 
在 下 面 的 例子 中 ，RBX 与 RAX 相 乘 ， 产 生 128 位 的 乘积 -16。 


mov rax,-4 
mov rbx,4 
imul rbx ; RDX = OFFFFFFFFFFFFFFFFh, RAX = -16 


也 就 是 说 ， 十 进 制 数 -16 在 RAX 中 表示 为 十 六 进 制 FFFF FFFF FFF0， 而 RDX 只 包含 
了 RAX 的 高 位 扩展 ， 即 它 的 符号 位 。 

三 操作 数 格式 也 可 以 用 于 64 位 模式 。 如 下 例 所 示 ， 被 乘 数 ( -16 ) 乘 以 4， 生 成 RAX 
中 的 乘积 -64: 


.data 

multiplicand QWORD -16 

.Code 

imul rax, multiplicand, 4 ; RAX = FFFFFFFFFFFFFFCO (-64) 


无 符号 乘法 ”由 于 有 符号 数 和 无 符号 数 乘积 的 低 半 部 分 是 相同 的 ， 因 此 双 操 作 数 和 三 操 
作 数 的 IMUL 指令 也 可 以 用 于 无 符号 乘法 。 但 是 这 种 做 法 也 有 一 点 不 便 的 地 方 : 进位 标志 位 
和 溢出 标志 位 将 无 法 表示 乘积 的 高 半 部 分 是 否 为 零 。 

2. IMUL 示例 

下 述 指令 执行 48 乘 以 4， 乘积 +192 保存 在 AX 中 。 虽 然 乘 积 是 正确 的 ， 但 是 AH 不 是 
AL 的 符号 扩展 ， 因 此 溢出 标志 位 置 1: 


mov al,48 
mov bl,4 
imul bl ; AX = 00COh, OF = 1 


下 述 指令 执行 -4 乘 以 4， 乘 积 -16 保存 在 AX 中 。AH 是 AL 的 符号 扩展 ， 因 此 溢出 标 
志 位 清 零 : 

mov al,-4 

mov bl,4a 

imul bl ; AX = FFFOh, OF = 0 

下 述 指令 执行 48 乘 以 4， 乘 积 +192 保存 在 DX : AX 中 。DX 是 AX 的 符号 扩展 ， 因 此 
溢出 标志 位 清 零 : 


mov ax,48 
mov bx,4 
imul bx ; DX:AX = 000000C0h, OF = 0 


下 述 指 令 执 行 32 位 有 符号 乘法 (4 823 424* 一 423 )， 乘 积 -2 040 308 352 保存 在 EDX : 
EAX 中 。 溢 出 标志 位 清 零 ， 因 为 EDX 是 EAX 的 符号 扩展 : 


mov eax,+4823424 
mov ebx,-423 
imul ebx ; EDX:EAX = FFFFFFFF86635D80h, OF = 0 


下 述 指令 展示 了 双 操 作 数 格式 : 
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.data 
wordl SWORD 4 
dwordl SDWORD 4 


.Code 

mov ax,-16 ; AX = -16 
mov by2 ; BX = 2 
imul bx,ax ; BX = -32 
imul bx,2 ; BX = -64 
imul bx,wordl ; BX = -256 
mov eax,-16 ; EAX = -16 
mov ebx,2 ; EBX = 2 
imul ebx,eax ; EBX = -32 
imul ebx,2 ; EBX = -64 
imul ebx,dwordl ; EBX = -256 


双 操 作 数 和 三 操作 数 IMUL 指令 的 目的 操作 数 大 小 与 乘 数 大 小 相同 。 因此 ， 有 可 能 发 生 
有 符号 溢出 。 执 行 这 些 类 型 的 IMUL 指令 后 ， 总 要 检查 溢出 标志 位 。 下 面 的 双 操 作 数 指令 展 
示 了 有 符号 溢出 ， 因 为 -64 000 不 适合 16 位 目的 操作 数 : 


mov ax,—-32000 


imul ax,2 $F el 
下 面 的 指令 展示 的 是 三 操作 数 格式 ,包括 了 有 符号 溢出 的 例子 : 
data 


wordl SWORD 4 
dwordl SDWORD 4 


-Code 

imul bx,wordl,-16 ; BX = wordl * -16 
imul ebx,dwordl,-16 ; EBX = dwordl * -16 
imul ebx,dwordl,-2000000000 ; 有 符号 溢出 ! 


7.3.3 测量 程序 执行 时 间 


通常 ， 程 序 员 发 现 用 测量 执行 时 间 的 方法 来 比较 一 段 代 码 与 另 一 段 代 码 执行 的 性 能 是 很 
有 用 的 。Microsoft Windows API 为 此 提供 了 必要 的 工具 ，Irvine32 库 中 的 GetMseconds 过 
程 可 使 其 变 得 更 加 方便 使 用 。 该 过 程 获取 系统 自 午 夜 过 后 经 过 的 毫秒 数 。 在 下 面 的 代码 示例 
中 ， 首 先 调用 GetMseconds， 这 样 就 可 以 记录 系统 开始 时 间 。 然 后 调用 想 要 测量 其 执行 时 间 
的 过 程 (FirstProcedureToTest)。 最 后 ， 再 次 调用 GetMseconds， 计 算 开 始 时 间 和 当前 毫秒 数 
的 差 值 : 


.data 

startTime DWORD ? 

procTimel DWORD ? 

procTime2 DWORD ? 

.Code 

call GetMseconds ; 获得 开始 时 间 
mov startTime,eax 


call FirstProcedureToTest 


Guli GetMseconds 7 获得 结束 时 间 
sub eax,startTime ; 计算 执行 花费 的 时 间 
mov procTimel,eax ; 保存 执行 花费 的 时 间 


当然 ， 两 次 调用 GetMseconds 会 消耗 一 点 执行 时 间 。 但 是 在 衡量 两 个 代码 实现 的 性 能 
时 间 之 比 时 ， 这 点 开销 是 微不足道 的 。 现 在 ,调用 另 一 个 被 测试 的 过 程 ， 并 保存 其 执行 时 间 
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(procTime2 ): 


call GetMseconds ; 获得 开始 时 间 
mov startTime,eax 


call SecondProcedureToTest 


call GetMseconds ; 获得 结束 时 间 


sub eax,startTime ; 计算 执行 花费 的 时 间 
mov procTime2,eax ; 保存 执行 花费 的 时 间 


则 procTimel 和 procTime2 的 比值 就 可 以 表示 这 两 个 过 程 的 相对 性 能 。 
MUL、IMUL 与 移 位 的 比较 
对 老 的 x86 处 理 器 来 说 ， 用 移 位 操作 实现 乘法 和 用 MUL、IMUL 指令 实现 乘法 之 间 有 


着 明显 的 性 能 差异 。 可 以 用 GetMseconds 过 程 比较 这 两 种 类 型 乘法 的 执行 时 间 。 下 面 的 两 个 
过 程 重复 执行 乘法 ， 用 常量 LOOP_COUNT 决定 重复 的 次 数 : 


mult by_ shifting PROC 


;用 SHL 执行 EAX 乘 以 36， 执 行 次 数 为 LOOP_COUNT 
‘ 
mov ecx,LOOP COUNT 
Ll: push eax 7 保存 原始 EAX 
mov ebx,eax 
shl eax,5 
shl ebx,2 
add eax,ebx 
Dopeax ; 恢复 EAX 
loop L1 
ret 
mult by shifting ENDP 


mult_by_MUL PROC 


下 
; 用 MUL 执行 EAX 乘 以 36， 执 行 次 数 为 LOOP_COUNT 
mov ecx,LOOP COUNT 
Ll: push eax ; 保存 原始 EAX 
mov ebx,36 
mul ebx 
pop eax ; 恢复 EAX 
loop Ll1 
ret 
mult by MUL ENDP 


下 述 代 码 调用 multi_by_shifting， 并 显示 计时 结果 。 完 整 的 代码 实现 参见 本 书 第 7 章 的 


CompareMult.asm 程序 : 
.data 
LOOP_ COUNT = OFFFFFFFFh 
.data 


intval DWORD 5 
startTime DWORD ? 


.code 

call GetMseconds ; 获取 开始 时 间 
mov startTime,eax 

mov eax,intval ;? 开始 乘法 


call mult by shifting 
call GetMseconds ; 获取 结束 时 间 
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sub eax,startTime 


call WriteDec ;? 显示 乘法 执行 花费 的 时 间 


用 同样 的 方法 调用 mnult by MUL， 在 传统 的 4GHz 奔腾 4 处 理 器 上 运行 的 结果 为 : 
SHL 方法 执行 时 间 是 6.078 秒 ，MUL 方法 执行 时 间 是 20.718 秒 。 也 就 是 说 ， 使 用 MUL 指 
令 速 度 会 慢 2.41 倍 。 但 是 ， 在 近期 的 处 理 器 上 运行 同样 的 程序 ， 调 用 两 个 函数 的 时 间 是 完 


全 一 样 的 。 这 个 例子 说 明 ，Intel 在 近期 的 处 理 器 上 已 经 设法 大 大 地 优化 了 MUL 和 IMUL 
指令 。 


7.3.4 DIV 指令 


32 位 模式 下 ，DIV (无 符号 除法 ) 指令 执行 8 位 、16 位 和 32 位 无 符号 数 除法 。 其 中 ， 
单 寄存 器 或 内 存 操作 数 是 除数 。 格 式 如 下 : 


DIV reg/mem8 
DIV reg/memié 
DIV reg/memi32 


下 表 给 出 了 被 除数 、 除 数 、 商 和 余数 之 间 的 关系 : 





64 位 模式 下 ，DIV 指令 用 RDX: RAX 作 被 除数 ， 用 64 位 寄存 器 和 内 存 操 作 数 作 除数 ， 
商 存 放 到 RAX， 余数 存 放 在 RDX 中 。 


DIV 示例 

下 述 指令 执行 8 位 无 符号 除法 ( 83h/2 )， 生 成 的 商 为 41h， 余 数 为 1: 
mov ax,0083h ; 被 除数 

mov bl,2 ; 除数 

div bl ; AL = 4lh, AH = 01h 

下 图 展示 了 寄存 器 内 容 的 变化 : 


AX BL AL AH 
/ [>[ 


下 述 指令 执行 16 位 无 符号 除法 (8003hMM100h)， 生 成 的 商 为 80h， 余 数 为 3。DX 包含 的 
是 被 除数 的 高 位 部 分 ， 因 此 在 执行 DIV 指令 之 前 ， 必 须 将 其 清 零 : 


mov dx,0 ; 清除 被 除数 高 16 位 

mov ax,8003h ; 被 除数 的 低 16 位 

mov cx,100h ; 除数 

GT ‘ex ; AX = 0080h, DX = 0003h 


下 图 展示 了 寄存 器 内 容 的 变化 : 
DX AX CX AX DX 
Rol # [ua elo 
下 述 指令 执行 32 位 无 符号 除法 ， 其 除数 为 内 存 操作 数 : 
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.data 
dividend QWORD 0000000800300020h 
divisor DWORD 00000100h 


.Code 

mov edx,DWORD PTR dividend + 4 ; 高 双 字 

mov eax,DWORD PTR dividend ; 低 双 字 

div divisor ; EAX = 08003000h, EDX = 00000020h 
下 图 展示 了 寄存 器 内 容 的 变化 : 


EDX EAX 除数 EAX EDX 
/ 一 [soosod] 
商 余数 


下 面 的 64 位 除法 生成 的 商 ( 0108 0000 0000 3330h) 在 RAX 中 ,余数 ( 0000 0000 0000 


0020h) 在 RDX 中 : 


.data 

dividend hi QWORD 0000000000000108h 

dividend lo QWORD 0000000033300020h 

divisor QWORD 0000000000010000h 

.code 

mov rdx, dividend hi 

mov rax, dividend lo 

div divisor ; RAX 
; RDX 


0108000000003330 
0000000000000020 


请 注意 ， 由 于 被 64k 除 ， 被 除数 中 的 每 个 十 六 进 制 数字 是 如 何 右 移 4 位 的 。( 若 被 16 


除 ， 则 每 个 数字 只 需 右 移 一 位 。) 
7.3.5 有 符号 数 除法 


有 符号 除法 几乎 与 无 符号 除法 相同 ， 只 有 一 个 重要 的 区 别 : 在 执行 除法 之 前 ， 必 须 对 被 
除数 进行 符号 扩展 。 符 号 扩展 是 指 将 一 个 数 的 最 高 位 复制 到 包含 该 数 的 变量 或 寄存 器 的 所 有 
高 位 中 。 为 了 说 明 为 何 有 此 必要 ， 让 我 们 先 不 这 么 做 。 下 面 的 代码 使 用 MOYV 把 -101 赋 给 


AX， 即 DX : AX 的 低 半 部 分 : 


.data 

wordVal SWORD -101 ; 009Bh 
-code 

mov dx,0 


mov ax,wordVal ; DX:AX = 0000009Bh (+155 


; BX 是 除数 


mov bx,2 
idiv bx 


; DX:AX 除 以 BX ( 有 符号 操作 ) 


可 惜 的 是 ，DX : AX 中 的 009Bh 并 不 等 于 一 101， 它 等 于 +155。 因 此 ， 除 法 产生 的 商 为 
+77， 这 不 是 所 期 望 的 结果 。 而 解决 该 问题 的 正确 方法 是 使 用 CWD ( 字 转 双 字 ) 指令 ， 在 进 
行 除法 之 前 在 DX : AX 中 对 AX 进行 符号 扩展 : 


.data 

wordVal SWORD -101 ; 009Bh 

-code 

mov dx,0 

mov ax,wordVal ; DX:AX= 0000009Bh (+155) 
cwd ; DX:AX= FFFFFF9Bh (-101) 


mov bx,2 
idiv bx 
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本 书 第 4 章 与 MOVSX 指令 一 起 介绍 过 符号 扩展 。x86 指令 集 有 几 种 符号 扩展 指令 。 首 
先 了 解 这 些 指 令 ， 然 后 再 将 其 应 用 到 有 符号 除法 指令 IDIV 中 。 

1. 符号 扩展 指令 (CBW、CWD、CDQ) 

Intel 提供 了 三 种 符号 扩展 指令 : CBW、CWD 和 CDQ。CBW ( 字 节 转 字 ) 指令 将 AL 
的 符号 位 扩展 到 AH， 保留 了 数据 的 符号 。 如 下 例 所 示 ，9Bh (AL 中 ) 和 FF9Bh (AX 中 ) 都 
等 于 十 进 制 的 -101: 


.data 

byteVal SBYTE -101 ; 9Bh 

.Code 

mov al,byteVval ; AL = 9Bh 

cbw ; AX = FF9Bh 

CWD ( 字 转 双 字 ) 指令 将 AX 的 符号 位 扩展 到 DX: 
data 

wordVal SWORD -101 ; FF9Bh 

.Code 

mov ax,wordVal ; AX = FF9Bh 

cwd ; DX:AX = FFFFFF9Bh 
CDQ ( 双 字 转 四 字 ) 指令 将 EAX 的 符号 位 扩展 到 EDX: 
.data 

dwordVal SDWORD -101 ; FFFFFF9Bh 

.Code 

mov eax,dwordVal 

cdgq ; EDX:EAX = FFFFFFFFFFFFFF9Bh 
2.1DIV 指令 


IDIV (有 符号 除法 ) 指令 执行 有 符号 整数 除法 ， 其 操作 数 与 DIV 指令 相同 。 执 行 8 位 除 
法 之 前 ， 被 除数 (AX) 必须 完成 符号 扩展 。 余 数 的 符号 总 是 与 被 除数 相同 。 
示例 1 下 述 指令 实现 -48 除 以 $。IDIV 执行 后 , AL 中 的 商 为 -9, AH 中 的 余数 为 -3: 


-data 

byteVal SBYTE -48 ;D0 十 六 进 制 

.Code 

mov al,byteVval ; 被 除数 的 低 字 节 

cbw AL 扩 展 到 AH 

mov bl,+5 除数 

idiv bl AL = -9, AH = -3 


下 图 展示 了 AL 是 如 何 通过 CBW 指令 符号 扩展 为 AX 的 : 
AL=-48 十 进 制 


(复制 8 位 ) 


11111111|11010000|AX=-48 十进制 


为 了 理解 被 除数 的 符号 扩展 为 什么 这 么 重要 ， 现 在 在 不 进行 符号 扩展 的 前 提 下 重复 之 前 
的 例子 。 下 面 的 代码 将 AH 初始 化 为 0， 这 样 它 就 有 了 确定 值 ， 然 后 没有 用 CBW 指令 转换 
被 除数 就 直接 进行 了 除法 : 









-data 
byteVal SBYTE -48 ;D0 十 六 进 制 
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.code 


mov ah,0 ? 被 除数 高 字 节 

mov al,byteVal ; 被 除数 低 字 节 

mov bl,+5 ;除数 

idiv bl ; AL = 41, AH = 3 


执行 除法 之 前 ，AX=00D0h (十 进 制 数 208 )。IDIV 把 这 个 数 除 以 5， 生 成 的 商 为 十 进 
制 数 41， 余数 为 3。 这 显然 不 是 正确 答案 。 
示例 2 16 位 除法 要 求 AX 符号 扩展 到 DX。 下 例 执 行 -5000 除 以 256: 


.data 

wordVal SWORD -5000 

.Code 

mov ax,wordVal ; 被 除数 的 低 字 

cwd ; AX 扩展 到 DX 

mov bx,+256 ; 除数 

idiv bx ; 商 RX=-19， 祭 数 DX=-I36 
示例 3 32 位 除法 要 求 EAX 符号 扩展 到 EDX。 下 例 执行 50 000 除 以 -256: 
.data 

dwordVal SDWORD +50000 

.code 

mov eax,dwordVal ; 被 除数 的 低 双 字 

cdq ; EAX 扩展 到 EDX 

mov ebx,-256 ; 除数 

idiv ebx ; 商 EAX= 一 195， 余 数 EDX=+80 





3. 除法 溢出 

如 果 除 法 操作 数 生成 的 商 不 适合 目的 操作 数 ， 则 产生 除法 溢出 〈divide overflow)。 这 将 
导致 处 理 器 异常 并 暂停 执行 当前 程序 。 例 如 ， 下 面 的 指令 就 产生 了 除法 溢出 ， 因 为 它 的 商 
(100h) 对 8 位 的 AL 目标 寄存 器 来 说 太 大 了 : 


mov ax,1000h 
mov bl,10h 
div bl ; AL 无 法 容纳 100h 


运行 这 段 代码 时 ，Visual Studio 就 会 产生 如 图 7-1 所 示 的 结果 错误 对 话 框 。 如 果 试 图 运 
行 除 以 零 的 代码 ， 也 会 显示 相同 的 对 话 框 。 





生 Unhandied exception at Ox00401016 in Project.exe: 0xC0000095: integer overflow，- 


图 7-1 除法 溢出 错误 示例 
对 此 有 个 建议 : 使 用 32 位 除数 和 64 位 被 除数 来 减少 出 现 除法 溢出 条 件 的 可 能 性 。 如 下 
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面 的 代码 所 示 ， 除 数 为 EBX， 被 除数 在 EDX 和 EAX 组 成 的 64 位 寄存 器 对 中 : 


mov eax,1000h 

cdq 

mov ebx,10h 

div ebx ; EAX = 00000100h [266] 


要 预防 除 以 零 的 操作 ， 则 在 进行 除法 之 前 检查 除数 : 


mov ax,dividend 
mov bl,divisor 





cmp bl,0 ; 检查 除数 

je NoDivideZero ; 为 零 ? 显示 错误 

div bl ; 不 为 零 : 继续 

NoDivideZero: ;显示 "Attmpt to divide by zero" 


7.3.6 ”实现 算术 表达 式 


第 4 章 介 绍 了 如 何 用 加 减 指令 实现 算术 表达 式 ， 现 在 还 可 以 再 加 上 乘法 和 除法 指令 。 初 
看 上 去 ， 实 现 算术 表达 式 的 工作 似乎 最 好 是 留 给 编译 器 的 编写 者 ， 但 是 动手 研究 一 下 还 是 能 
学 到 不 少 东西 。 读 者 可 以 学 习 编 译 器 怎样 优化 代码 。 此 外 ， 与 典型 编译 器 在 乘法 操作 后 检查 
乘积 大 小 相 比 ， 还 能 实现 更 好 的 错误 检查 。 进 行 32 位 操作 数 相 乘 时 ， 绝 大 多 数 高 级 语言 编 
译 器 都 会 忽略 乘积 的 高 32 位 。 而 在 汇编 语言 中 ， 可 以 用 进位 标志 位 和 溢出 标志 位 来 说 明 乘 
积 是 否 为 32 位 。 这 些 标志 位 用 法 的 解释 参见 7.4.1 节 和 7.4.2 节 。 
提示 ”有 两 种 简单 的 方法 可 以 查看 C++ 编译 器 生成 的 汇编 代码 : 一 种 方法 是 用 
Visual Studio 调试 时 ， 在 调试 窗口 中 右键 点 击 ， 选择 Go to Disassembly。 另 一 种 方法 
是 ， 在 Project 菜单 中 选择 Properties， 生 成 一 个 列表 文件 。 在 Configuration Properties， 
选择 Microsoft Macro Assembler， 再 选择 Listing File。 在 对 话 窗 口中 ， 将 Generate 
Preprocessed Source Listing 设置 为 Yes，List All Available Information 也 设置 为 Yes。 










示例 1 使 用 32 位 无 符号 整数 ， 用 汇编 语言 实现 下 述 C++ 语句 : 


Var4 = (varl + var2) * var3; 267 


这 个 问题 很 简单 ， 因 为 可 以 从 左 到 右 来 处 理 ( 先 加 法 再 乘法 )。 执 行 了 第 二 条 指令 后 ， 
EAX 存放 的 是 varl 与 var2 之 和 。 第 三 条 指令 中 ，EAX 乘 以 var3 ， 乘 积存 放 在 EAX 中 : 


mov eax,varl 
add eax,var2 


mul var3 ; EAX = EAX * var3 
jc tooBig ; 无 符号 溢出 ? 
mov var4,eax 
jmp next 
tooBig: ; 显示 错误 消息 


如 果 MUL 指令 产生 的 乘积 大 于 32 位 ， 则 JC 指令 跳 转 到 有 标号 指令 来 处 理 错误 。 
示例 2 使 用 32 位 无 符号 整数 实现 下 述 C++ 语句 : 


var4 = (varl * 5) / (var2 - 3); 


本 例 有 两 个 用 括号 括 起 来 的 子 表达 式 。 左 边 的 子 表 达 式 可 以 分 配给 EDX : EAX， 因 此 
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不 必 检 查 滋 出。 右边 的 子 表达 式 分 配给 EBX， 最 后 用 除法 完成 整个 表达 式 : 


mov eax,varl ;? 左边 的 子 表达 式 
mov ebx,5 

mul ebx ;EDX: EAX= 乘积 
mov ebx,var?2 ? 右边 的 子 表达 式 
sub ebx,3 

div ebx ; 最 后 的 除法 


mov vard4,eax 


示例 3 使 用 32 位 有 符号 整数 实现 下 述 C++ 语句 : 


Var4 = (varl * -5) / (-var2 % var3); 


与 之 前 的 例子 相 比 ， 这 个 例子 需要 一 些 技巧 。 可 以 先 从 右边 的 表达 式 开始 ， 并 将 其 保 
存在 EBX 中 。 由 于 操作 数 是 有 符号 的 ， 因 此 必须 将 被 除数 符号 扩展 到 EDX， 再 使 用 IDIV 


moV eax,var2 ; 开始 计算 右边 的 表达 式 


neg eax 


cdq ;符号 扩展 被 除数 
idiv var3 ;EDX= 余数 
mov ”ebx,edx 。 ;EBX- 右边 表达 式 的 结果 


第 二 步 ， 计 算 左 边 的 表达 式 ， 并 将 乘积 保存 在 EDX: EAX 中 : 


mov eax,-5 ; 开始 计算 左边 表达 式 
imul varl ?EDX: EAX= 左边 表达 式 的 结果 


最 后 ， 左 边 表达 式 结 果 (EDX: EAX) 除 以 右边 表达 式 结果 (EBX ): 


7 ‘bx ;最 后 计算 除法 
mov var4,eax ; 商 
7.3.7 本 节 回 顾 


1. 请 说 明 执行 MUL 指令 和 单 操作 数 的 IMUL 指令 时 ， 不 会 发 生 溢出 的 原因 。 
2. 生成 乘积 时 ， 单 操作 数 IMUL 指令 与 MUL 指令 有 何不 同 ? 

3. 什么 情况 下 单 操 作 数 IMUL 指令 会 将 进位 标志 位 和 溢出 标志 位 置 1 ? 

4. DIV 指令 中 , 若 EBX 为 操作 数 ， 则 商 保存 在 哪个 寄存 器 中 ? 

5. DIV 指令 中 ， 若 BX 为 操作 数 ， 则 商 保存 在 哪个 寄存 器 中 ? 

6. MUL 指令 中 , 若 BL 为 操作 数 ， 则 乘积 保存 在 哪个 寄存 器 中 ? 

7. 举例 说 明 ， 在 调用 IDIV 指令 前 ， 如 何 对 其 16 位 操作 数 进 行 符号 扩展 。 


7.4 扩展 加 减法 


扩展 精度 加 减法 (extended precision addition and subtraction) 是 对 基本 没有 大 小 限制 的 
数 进行 加 减法 的 技术 。 比 如 ， 在 C++ 中 ， 没 有 标准 运算 符 会 允许 两 个 1024 位 整数 相 加 。 但 
是 在 汇编 语言 中 ，ADC ( 带 进位 加 法 ) 和 SBB ( 带 借 位 减法 ) 指令 就 很 适合 进行 这 类 操作 。 


7.4.1 ADC 指令 
ADC ( 带 进位 加 法 ) 指令 将 源 操作 数 和 进位 标志 位 的 值 都 与 目的 操作 数 相 加 。 该 指令 格 
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式 与 ADD 指令 一 样 ， 且 操作 数 大 小 必须 相同 : 


ADC reg,reg 
ADC mem,reg 
ADC reg,mem 
ADC mem, imm 
ADC reg,imm 


例如 ， 下 述 指令 实现 两 个 8 位 整数 相 加 (FFh+FFh)， 产 生 的 16 位 和 数 存 人 DL : AL， 
其 值 为 01FEh: 


mov dl,0 

mov al,0FFh 

add al, 0FFh ; AL = FEh 

adc dl,0 ; DL/AL = 01FEh 


下 图 展示 了 这 两 个 数 相 加 过 程 中 的 数据 活动 。 首 先 ，FFh 与 AL 相 加 ， 生 成 FEh 存 人 
AL 寄存 器 ， 并 将 进位 标志 位 置 1。 然 后 ， 将 0 和 进位 标志 位 与 DL 寄存 器 相 加 : 


AE 好 
TI 本 IT 
DL 
TO 网 TITTI 00000000|] + — >|00000001 
a 


同样 ， 下 述 指 令 实 现 两 个 32 位 整数 相 加 (FFFF FFFFh+ FFFF FFFFh)， 产 生 的 64 位 和 
数 存 人 EDX: EAX， 其 值 为 : 0000 0001 FFFF FFFEh: 


mov edx,0 
mov eax,OFFFFFFFFh 
add eax,O0FFFFFFFFh 
adc edx,0 


7.4.2 ”扩展 加 法 示例 


接 下 来 将 说 明 过 程 Extended_Add 实现 两 个 大 小 相同 的 扩展 整数 的 加 法 。 利 用 循环 ， 该 
过 程 将 两 个 扩展 整数 当 作 并 行 数组 实现 加 法 操作 。 数 组 中 每 对 数值 相 加 时 ， 都 要 包括 前 一 次 
循环 迭代 执行 的 加 法 所 产生 的 进位 标志 位 。 实 现 过 程 时 ， 假 设 整数 存储 在 字 节 数组 中 ， 不 过 
本 例 很 容易 就 能 修改 为 双 字 数组 的 加 法 。 

该 过 程 接收 两 个 指针 ， 存 人 ESI 和 EDI， 分 别 指向 参与 加 法 的 两 个 整数 。EBX 寄存 器 
指向 缓冲 区 ， 用 于 存放 和 数 ， 该 缓冲 区 的 前 提 条 件 是 必须 比 两 个 加 数 大 一 个 字 节 。 此 外 ,过 
程 还 用 ECX 接收 最 长 加 数 的 长 度 。 两 个 加 数 都 需要 按 小 端 顺序 存放 ， 即 其 最 低 字 节 存 放 在 
该 数组 的 起 始 地 址 。 过 程 代 码 如 下 所 示 ， 添 加 了 代码 行 编号 便于 进行 详细 讨论 ; 


Extendea Ra PROC 


; 计算 两 个 以 字 节 数组 存放 的 扩展 整数 之 和 。 
; 接收 : ESI 和 EDI 为 两 个 加 数 的 指针 ， 
EBX 为 和 数 变量 指针 ，ECX 为 
; 相 加 的 字 节 数 。 
; 和 数 存 储 区 必须 比 输入 的 操作 数 多 一 个 字 节 。 


;返回 : 无 


DO 人骨 甩 乒 
a0 0 0 da qa 4 ul 5 6 Wp 
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12: -一 -一 一 -一 一 一 -一 -一 一 一 一 一 -一 一- 一 -一 一 一 -一 一 一 -一 一 -一 -一 --------- 一 
和 pushad 

14: clc ; 清除 进位 标志 位 
15s 

16: L1l: mov al,[esil] ; 取 第 一 个 数 

六， adc al,[edi] ; 与 第 二 个 数 相 加 
18: pushfd ; 保存 进位 标志 位 
19: mov [ebx],al ; 保存 部 分 和 
20: add 远征 和 5 ; 三 个 指针 都 加 1 
21: add edi,l 

22: add ebx,1 

23: popfd ; 恢复 进位 标志 位 
24: Loop Ll ; 重复 循环 

2 

26: mov byte ptr [ebx],0 下 

27; adc ES 人 
28: popad 4 
29: ret 

30;:; Extended Add ENDP 


当 第 16 行 和 第 17 行将 两 个 数组 的 最 低 字 节 相 加 时 ， 加 法 运算 可 能 会 将 进位 标志 位 置 
1。 因 此 ,第 18 行将 进位 标志 位 压 人 堆栈 进行 保存 就 很 重要 ， 因 为 在 循环 重复 时 会 用 到 进位 
标志 位 。 第 19 行 保 存 了 和 数 的 第 一 个 字 节 ， 第 20 ~ 22 行将 三 个 指针 (两 个 操作 数 ， 一 个 
和 数 ) 都 加 1。 第 23 行 恢复 进位 标志 位 ， 第 24 行将 循环 返回 到 第 16 行 。( LOOP 指令 不 会 
修改 CPU 的 状态 标志 位 。) 再 次 循环 时 ， 第 17 行进 行 的 是 第 二 对 字 节 的 加 法 ， 其 中 包括 进 
位 标志 位 的 值 。 因 此 ， 如 果 第 一 次 循环 过 程 产生 了 进位 ， 则 第 二 次 循环 就 要 包括 该 进位 。 按 
照 这 种 方式 循环 ， 直 到 所 有 的 字 节 都 完成 了 加 法 。 然 后 ， 最 后 的 第 26 行 和 第 27 行 检查 操作 
数 最 高 字 节 相 加 是 否 产生 进位 ， 若 产生 了 进位 ， 就 将 该 值 加 到 和 数 多 出 来 的 那个 字 节 中 。 

下 面 的 代码 示例 调用 Extended_Add， 并 向 其 传递 两 个 8 字 节 的 整数 。 要 注意 为 和 数 多 


分 配 一 个 字 节 : 


data 


opl BYTE 34h,12h,98h,74h,06h,0A4h,OB2h,0A2h 
op2 BYTE 02h,45h,23h,00h,00h,87h,10h,80h 


sum BYTE 9 dup(0) 


.code 

main PROC 
mov esi,OFFSET opl 
mov edi,OFFSET op2 
mov ebx,OFFSET sum 


mov ecx,LENGTHOF opl 


call Extended Add 


mov esi,OFFSET sum 


mov ecx,LENGTHOF sum 


call Display Sum 
call Crlf 


; 第 一 个 操作 数 
; 第 二 个 操作 数 
7 和 数 

;? 字 节 数 


上 述 程序 的 输出 如 下 所 示 ， 加 法 产生 了 一 个 进位 : 


0122C32B0674BB5736 


过 程 Display_Sum (来 自 同 一 个 程序 ) 按照 正确 的 顺序 显示 和 数 


次 显示 到 最 低 字 节 : 


， 即 从 最 高 字 节 开始 依 
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Display_ Sum PROC 
pushad 
; 指向 最 后 一 个 数组 元 素 
add esi,ecx 
sub esi,TYPE BYTE 
mov ebx,TYPE BYTE 27: 


Ll: mov al,[esil] ; 取 一 个 数组 字 节 
call WriteHexB 7 显示 该 字 节 
sub esi,TYPE BYTE ; 指向 前 一 个 字 节 
loop Ll1 


popad 
ret 
Display_ Sum ENDP 


7.4.3 SBB 指令 


SBB ( 带 借 位 减法 ) 指令 从 目的 操作 数 中 减 去 源 操作 数 和 进位 标志 位 的 值 。 人 允许 使 用 的 
操作 数 与 ADC 指令 相同 。 下 面 的 示例 代码 用 32 位 操作 数 实现 64 位 减法 ，EDX : EAX 的 值 
为 0000 0007 0000 0001h， 从 该 值 中 减 去 2。 低 32 位 先 执行 减法 ， 并 设置 进位 标志 位 ， 然 后 
高 32 位 再 进行 包括 进位 标志 位 的 减法 : 

mov edx,7 ;高 32 位 

mov eax,1 ; 低 32 位 

sub eax,2 ; 减 2 

sbb edx,0 ;高 32 位 减法 

图 7-2 展示 了 这 两 个 数 相 减 过 程 中 的 数据 活动 。 首 先 ，EAX 减 2， 差 值 FFFF FFFFh 
存放 在 EAX 中 。 由 于 是 从 小 数 中 减 去 大 数 ， 因 此 产生 借 位 ， 将 进位 标志 位 置 1。 然 后 ， 用 
SBB 指令 从 EDX 中 减 去 0 和 进位 标志 位 。 


EDX 


EAX 
执行 
EAX EAX 
sun noc2 [oonooor] - [GO 一 
EDX 位 EDX 
san gpxo [oooo] - Ga [1], 一 > [Downoag 


EDX EAX 
和 


7-2 用 SBB 实现 64 位 减法 


7.4.4 本 节 回 顾 
1. 请 描述 ADC 指令 。 
2. 请 描述 SBB 指令 。 [Ze 


3. 执行 下 述 指令 后 ，EDX: EAX 中 的 值 是 多 少 ? 


mov edx,10h 

mov eax,O0A0000000h 
add eax,20000000h 
adc edx,0 
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执行 下 述 指令 后 ，EDX: EAX 中 的 值 是 多 少 ? 


mov edx,100h 
mov eax,80000000h 
sub eax,90000000h 


sbb edx,0 

5. 执行 下 述 指令 后 ，DX 中 的 值 是 多 少 (STC 将 进位 标志 位 置 1 ) ? 
mov dx,5 
stc 7 进位 标志 位 置 1 


mov ax,10h 
adc dx,ax 


7.5 ASCIIl 和 非 压 缩 十 进 制 运算 


(7.5 节 讨 论 的 指令 只 能 用 于 32 位 模式 编程 。) 到 目前 为 止 ， 本 书 讨论 的 整数 运算 处 理 的 
都 是 二 进 制 数 。 虽 然 CPU 用 二 进 制 运算 , 但 是 也 可 以 执行 ASCII 十 进 制 串 的 运算 。 使 用 后 
者 进行 运算 ， 对 用 户 而 言 既 便于 输入 也 便于 在 控制 台 窗 口 显示 ， 因 为 不 用 进行 二 进 制 转换 。 
假设 程序 需要 用 户 输入 两 个 数 ， 并 将 它们 相 加 。 若 用 户 输入 3402 和 1256， 则 程序 输出 如 下 
所 示 : 


输入 第 一 个 数 : 3402 

输入 第 二 个 数 : 1256 

和 数 : 4658 

有 两 种 方法 可 以 计算 并 显示 和 数 : 

1) 将 两 个 操作 数 都 转换 为 二 进 制 ， 进 行 二 进 制 加 法 ， 再 将 和 数 从 二 进 制 转换 为 ASCII 
数字 串 。 

2) 直接 进行 数字 串 的 加 法 ， 按 序 相 加 每 对 ASCII 数字 ( 2+6、0+5、4+2 、3+1 )。 和 数 
为 ASCII 数字 串 ， 因 此 可 以 直接 显示 在 屏幕 上 。 

第 二 种 方法 需要 在 执行 每 对 ASCII 数字 相 加 后 ,用 特殊 指令 来 调整 和 数 。 有 四 类 指令 
用 于 处 理 ASCII 加 法 、 减 法 、 乘 法 和 除法 ， 如 下 所 示 : 

AAA (执行 乘法 后 进行 ASCIL 调整 ) 

AAS (执行 除法 前 进行 ASCIL 调整 ) 


ASCII 十 进 制 数 和 非 压 缩 十 进 制 数 ” 非 压缩 十 进 制 整数 的 高 4 位 总 是 为 零 ， 而 ASCII 


十 进 制 数 的 高 4 位 则 应 该 等 于 0011b。 在 任何 情况 下 ， 这 两 种 类 型 的 每 个 数字 都 占用 一 个 字 
节 。 下 面 的 例子 展示 了 3402 用 这 两 种 类 型 存放 的 格式 : 


ASCI 格式 : 非 压缩 格式 : 03|04|o0|o2| 
(所 有 数值 都 为 十 六 进 制 形式 ) 
尽管 ASCII 运算 执行 速度 比 二 进 制 运算 要 慢 很 多 ， 但 是 它 有 两 个 明显 的 优点 : 
e 不 必 在 执行 运算 之 前 转换 串 格式 。 
e 使 用 假设 的 十 进 制 小 数 点 ， 使 得 实数 操作 不 会 出 现 浮 点 运算 的 舍 人 误差 的 危险 。 


ASCII 加 减法 运行 操作 数 为 ASCII 格式 或 非 压 缩 十 进 制 格 式 ， 但 是 乘除 法 只 能 使 用 非 压 
缩 十 进 制 数 。 
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7.5.1 AAA 指令 


在 32 位 模式 下 ，AAA (加 法 后 的 ASCII 调整 ) 指令 调整 ADD 或 ADC 指令 的 二 进 制 运 
算 结果 。 设 两 个 ASCII 数 字 相 加 ， 其 二 进 制 结果 存放 在 AL 中 , 则 AAA 将 AL 转换 为 两 个 
非 压 缩 十 进 制 数字 存 人 AH 和 AL。 一 旦 成 为 非 压缩 格式 ,通过 将 AH 和 AL 与 30h 进 OR 
运算 ,很 容易 就 能 把 它们 转换 为 ASCII 码 。 

下 例 展示 了 如 何 用 AAA 指令 正确 地 实现 ASCII 数字 8 加 2。 在 执行 加 法 之 前 ， 必 须 把 
AH 清 零 ， 否 则 它 将 影响 AAA 执行 的 结果 。 最 后 一 条 指令 将 AH 和 AL 转换 为 ASCII 数字 : 


mov ah,0 

mov al,'8’' ; AX = 0038h 

add al,'a’ ; AX = 006Ah 

aaa ; AX=0100h ( 结果 进行 ASCII 调整 ) 
or ax,3030h ; RX=3130h='10' ( 转换 为 ASCII 码 ) 
使 用 AAA 实现 多 字 节 加 法 


现在 来 查看 一 个 过 程 ， 其 功能 为 实现 包含 了 隐 含 小 数 点 的 ASCII 十 进 制 数值 相 加 。 由 
于 每 次 数字 相 加 的 进位 标志 位 都 要 传递 到 更 高 位 ， 因此， 过 程 的 实现 要 比 想象 的 更 复杂 一 
些 。 下 面 的 伪 代 码 中 ，acc 代表 的 是 一 个 8 位 的 累加 寄存 器 : 


esi (index) = length of first_number - 1 
edi (index) = length of first_number 
ecx = length of first_number 
Set carry value to 0 
Loop 
acc = first numberlesil] 
add previous carry to acc 
Save carry in carry!l 
acc += Second number[esi] 
OR the carry with carryI 
sum[edi] = acc 
aec edi 
Until ecx == 
Store last carry digit in sum 


进位 值 必须 总 是 被 转换 为 ASCII 码 。 将 进位 值 与 第 一 个 操作 数 相 加 时 ， 就 需要 用 AAA 
来 调整 结果 。 程 序 清单 如 下 : 


7ASCII 加 法 (ASCII add.asm) 
;7 对 有 隐 含 固定 小 数 点 的 串 执 行 ASCII 运算 . 


INCLUDE Irvine32 .inc 
DECIMAL OFFSET = 5 ;距离 串 右 侧 的 偏 移 量 


data 

decimal one BYTE "100123456789765" ; 1001234567.89765 
decimal two BYTE "900402076502015" ; 9004020765.02015 
sum BYTE (SIZEOF decimal one + 1) DUP(0),0 

.Code 

main PROC 


; 从 最 后 一 个 数字 位 开始 
mov esi,SIZEOF decimal one - 1 
mov edi,SIZEOF decimal one 
mov ecx,SIZEOF decimal one 


mov bh,0 ; 进位 值 清 堆 
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L1: mov ah,0 7 执行 加 法 前 清除 AH 
mov al,decimal one[esi] 


; 取 第 一 个 数字 

人 ; 加 上 之 前 的 进位 值 
mov bh,ah ;调整 和 数 AH- 进位 什 
二 bh' 30h pa ep on 

i 7 ASCII 
2 al,decimal two[lesi] ， 加 第 二 个 数字 
or bh,ah ; 调整 和 数 RH= 进位 值 
or bh, 30h ; 进位 值 与 carryl 进行 OR 运算 
or al,30h ; 将 其 转换 为 RSCII 码 
mov sum[ledi],al 7 将 AL 转换 为 ASCII 码 
dec esi ; 将 AL 保存 到 sum 
dec edi ; 后 退 一 个 数字 
loop Ll 
mov sum[ledi],bh ; 保存 最 后 的 进位 值 

; 显示 和 数字 符 串 。 


mov edx,OFFSET sum 
call WriteString 


oall CrlE 
exit 
main ENDP 
275 END main 





程序 输出 如 下 所 示 ， 和 数 没有 显示 十 进 制 小 数 点 : 


7.5.2 AAS 指令 


32 位 模式 下 ，AAS (减法 后 的 ASCII 调整 ) 指令 紧 随 SUB 或 SBB 指令 之 后 ， 这 两 条 指 
令 执 行 两 个 非 压 缩 十 进 制 数 的 减法 ， 并 将 结果 保存 到 AL 中 。AAS 指令 将 AL 转换 为 ASCII 
码 的 数字 形式 。 只 有 减法 结果 为 负 时 ， 调 整 才 是 必需 的 。 比 如 ， 下 面 的 语句 实现 ASCII 码 
数字 8 减 去 9: 


.data 
vall BYTE '8° 
val2 BYTE '9° 


-Code 
mov ah,0 
mov al,vall ; AX = 0038h 
sub al,val2 ; AX = 00FFh 
aas ; AX = FF09h 
pushf ; 保存 进位 标志 位 
Sr 0 ; AX = FF39h 
popf ; 恢复 进位 标志 位 
执行 SUB 指令 后 ，AX 等 于 00FFh。AAS 指令 将 AL 转换 为 09h，AH 减 1 等 于 FFh， 
并 且 把 进位 标志 位 置 1。 
7.5.3 AAM 指令 


32 位 模式 下 ，MUL 执行 非 压缩 十 进 制 乘法 ，AAM (乘法 后 的 ASCII 调整 ) 指令 转换 
由 其 产生 的 二 进 制 乘积 。 乘 法 只 能 使 用 非 压缩 十 进 制 数 。 下 面 的 例子 实现 5 乘 以 6， 并 调整 
AX 中 的 结果 。 调 整 后 ，AX=0300h， 非 压缩 十 进 制 表示 为 30: 
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.data 

AscVal BYTE 05h,06h 

.Code 

mov bl,ascVal ; 第 一 个 操作 数 
mov al,[ascVal+1l1] ; 第 二 个 操作 数 
mul bl ; AX = 001Eh 
aam ; AX = 0300h 


7.5.4 ” AAD 指令 


32 位 模式 下 ，AAD (除法 之 前 的 ASCII 调整 ) 指令 将 AX 中 的 非 压 缩 十 进 制 被 除数 转 
换 为 二 进 制 ， 为 执行 DIV 指令 做 准备 。 下 面 的 例子 把 非 压 缩 0307h 转换 为 二 进 制 数 ， 然 后 
除 以 5。DIV 指令 在 AL 中 生成 商 07h， 在 AH 中 生成 余数 02h: 


-data 
quotient BYTE ? 
remainder BYTE ? 
.Code 


mov ax,0307h ; 被 除数 

aad ; AX = 0025h 
mov bl,5 ; 除数 

div bl ; AX = 0207h 


mov quotient,al 
mov remainder,ah 


7.5.5 ”本 节 回 顾 


1. 编写 一 条 指令 ,将 AX 中 的 一 个 两 位 非 压缩 十 进 制 整 数 转换 为 十 进 制 的 ASCII 码 。 
2. 编写 一 条 指令 ， 将 AX 中 的 一 个 两 位 ASCII 码 十 进 制 整数 转换 为 非 压 缩 十 进 制 形式 。 
3. 编写 有 两 条 指令 的 序列 ， 将 AX 中 的 一 个 两 位 ASCII 码 十 进 制 整数 转换 为 二 进 制 。 
4. 编写 一 条 指令 ， 将 AX 中 的 一 个 无 符号 二 进 制 整数 转换 为 非 压缩 十 进 制 数 。 


7.6 ”压缩 十 进 制 运算 


(7.6 节 讨 论 的 指令 仅 用 于 32 位 编程 模式 。) 压缩 十 进 制 数 的 每 个 字 节 存放 两 个 十 进 制 
数字 ， 每 个 数字 用 4 位 表示 。 如 果 数 字 个 数 为 奇数 ， 则 最 高 的 半 字 节 用 零 填充 。 存 储 大 小 
可 变 : 


bcdl QWORD 2345673928737285h ; 十进制 数 2 345 673 928 737 285 


bcd2 DWORD 12345678h 7 十 进 制 数 12 345 678 
bcd3 DWORD 08723654h ; 十 进 制 数 8 723 654 
bcd4 WORD 9345h ; 十 进 制 数 9345 

bcd5 WORD 0237h ; 十 进 制 数 237 

bcd6 BYTE 34h ; 十 进 制 数 34 
压缩 十 进 制 存储 至 少 有 两 个 优势 : 


e 数据 几乎 可 以 包含 任何 个 数 的 有 效 数字 。 这 使 得 以 很 高 的 精度 执行 计算 成 为 可 能 。 

e 实现 压缩 十 进 制 数 与 ASCII 码 之 间 的 相互 转换 相对 简单 。 

DAA (加 法 后 的 十 进 制 调整 ) 和 DAS (减法 后 的 十 进 制 调整 ) 这 两 条 指令 调整 压缩 十 进 
制 数 加 减法 的 结果 。 可 惜 的 是 ， 目 前 还 没有 与 乘除 法 有 关 的 相似 指令 。 在 这 些 情 况 下 ， 相 乘 
或 相 除 的 数 必须 是 非 压 缩 的 ， 执 行 后 再 压缩 。 
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7.6.1 DAA 指令 


32 位 模式 下 , ADD 或 ADC 指令 在 AL 中 生成 二 进 制 和 数 , DAA (加 法 后 的 十 进 制 调整 ) 
指令 将 和 数 转换 为 压缩 十 进 制 格式 。 比 如 ， 下 述 指令 执行 压缩 十 进 制 数 35 加 48。 二 进 制 和 
数 (7Dh) 被 调整 为 83h， 即 35 和 48 的 压缩 十 进 制 和 数 。 
mov al,35h 
add al,48h “AB 7Dh 
[277] daa ; AL = 83h (调整 后 的 结果 ) 
DAA 的 内 部 逻辑 请 参阅 Intel 指令 集 参 考 手册 。 
示例 下 面 的 程序 执行 两 个 16 位 压缩 十 进 制 整数 加 法 ， 并 将 和 数 保存 在 一 个 压缩 双 字 
加 法 要 求 和 数 变量 的 存储 大 小 比 操作 数 多 一 个 数字 : 
; 压缩 十 进 制 示例 (AddPacked.asm) 
; 演示 压缩 十 进 制 加 法 
INCLUDE Irvine32.inc 


+ 


-data 

packed 1 WORD 4536h 
packed 2 WORD 7207h 
sum DWORD ? 


.Code 

main PROC 

; 初始 化 和 数 与 索引 . 
mov sum,0 
mov esi,0 


; 低 字 节 相 加 。 


mov al,BYTE PTR packed l[esi] 
add al,BYTE PTR packed 2[esilj 
daa 
mov BYTE PTR sum[esil],al 

; 高 字 节 相 加 ， 包 括 进 位 标志 位 。 
inc esi 
mov al,BYTE PTR packed ll[esi]) 
adc al,BYTE PTR packed 2[esi] 
daa 
mov BYTE PTR sum[lesi],al 


;车 还 有 进位 ， 则 加 上 该 进位 值 。 
inc esi 
mov al70 


adc al,0 
mov BYTE PTR sum[lesi],al 
; 用 十 六 进 制 显 示 和 数 ， 


mov eax,sum 
call WriteHex 
Call ‘Crlf 
exit 
main ENDP 
END main 


显然 ， 这 个 程序 包含 重复 代码 ， 因 此 建议 使 用 循环 结构 。 本 章 的 一 道 习题 将 会 要 求 编写 
278] ”一 个 过 程 ， 实 现任 意 大 小 的 压缩 十 进 制 整数 加 法 。 


7.6.2 ”DAS 指令 
32 位 模式 下 ，SUB 或 SBB 指令 在 AL 中 生成 二 进 制 结果 ，DAS (减法 后 的 十 进 制 调 整 ) 
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指令 将 其 转换 为 压缩 十 进 制 格式 。 比 如 ， 下 面 的 语句 计算 压缩 十 进 制 数 85 减 48， 并 调整 
结果 : 


mov bl,48h 
mov al,85h 


sub al,bl ; AL = 3Dh 
das ; AL = 37h (调整 后 的 结果 ) 
DAS 的 内 部 逻辑 请 参阅 Intel 指令 集 参 考 手册 。 

7.6.3 ”本 节 回 顾 


1. 举例 说 明 ， 什 么 情况 下 DAA 指令 会 把 进位 标志 位 置 1 ? 
2. 举例 说 明 ， 什 么 情况 下 DAS 指令 会 把 进位 标志 位 置 1 ? 
3. 两 个 长 度 为 n 字 节 的 压缩 十 进 制 整 数 相 加 时 ， 和 数 应 该 保留 多 少 字 节 ? 


7.7 本章 小 结 


与 前 面 章节 介绍 的 位 元 指令 一 样 ， 移 位 指令 也 是 汇编 语言 最 显著 的 特点 之 一 。 一 个 数 移 
位 就 意味 着 把 它 的 位 元 进行 右 移 或 左 移 。 

SHL ( 左 移 ) 指令 把 目标 操作 数 的 每 一 位 都 向 左 移动 ， 最 低位 用 0 填充 。SHL 最 大 的 作 
用 之 一 是 快速 实现 与 2 的 究 相 乘 。 任何 操 作 数 左 移 n 位 即 为 乘 以 2"。SHR ( 右 移 ) 指令 则 把 
每 一 位 都 向 右 移动 ， 最 高 位 用 0 填充 。 任 何 操 作 数 右 移 n 位 即 为 除 以 2"。 

SAL (算术 左 移 ) 和 SAR (算术 右 移 ) 是 特别 为 有 符号 数 移 位 设计 的 指令 。 

ROL (循环 左 移 ) 指令 把 每 一 位 向 左 移动 ， 并 将 最 高 位 复制 到 进位 标志 位 和 最 低位 。 
ROR (循环 右 移 ) 指令 把 每 一 位 向 右 移 动 ， 并 将 最 低位 复制 到 进位 标志 位 和 最 高 位 。 

RCL ( 带 进位 循环 左 移 ) 指令 把 每 一 位 都 左 移 ， 并 先 将 进位 标志 位 复制 到 移 位 结果 的 最 
低位 ， 再 将 最 高 位 复制 到 进位 标志 位 。RCR ( 带 进位 循环 右 移 ) 指令 把 每 一 位 都 右 移 ， 并 将 
最 低位 复制 到 进位 标志 位 ， 而 进位 标志 位 则 复制 到 结果 的 最 高 位 。 

x86 处 理 器 可 使 用 的 SHLD ( 双 精 度 左 移 ) 和 SHRD ( 双 精 度 右 移 ) 指令 对 大 数 的 移 位 非 
常 有 用 。 

32 位 模式 下 , MUL 指令 实现 一 个 8 位 、16 位 或 32 位 的 操作 数 与 AL、AX 或 EAX 相 乘 。 
64 位 模式 下 ， 一 个 数 还 可 以 实现 与 RAX 寄存 器 相 乘 。IMUL 指令 执行 有 符号 数 乘法 ， 它 有 
三 种 格式 : 单 操作 数 、 双 操作 数 和 三 操作 数 。 

32 位 模式 下 ，DIV 指令 实现 8 位 、16 位 或 32 位 操作 数 的 除法 。64 位 模式 下 ， 还 可 以 
实现 64 位 除法 。IDIV 指令 执行 有 符号 数 乘法 ， 其 格式 与 DIV 指令 相同 。 

CBW ( 字 节 转 字 ) 指令 把 AL 的 符号 位 扩展 到 AH 寄存 器 。CDQ ( 双 字 转 四 字 ) 指令 把 
EAX 的 符号 位 扩展 到 EDX 寄存 器 。CWD ( 字 转 双 字 ) 指令 把 AX 的 符号 位 扩展 到 DX 寄 
存 器 。 

扩展 加 减法 是 指 加 减 任意 大 小 的 数 ，ADC 和 SBB 指令 可 以 用 于 实现 这 种 加 减 运算 。 
ADC ( 带 进位 加 法 ) 指令 实现 源 操 作 数 与 进位 标志 位 的 内 容 和 目的 操作 数 相 加 。SBB ( 带 借 
位 减法 ) 指令 实现 目的 操作 数 减 去 源 操作 数 和 进位 标志 位 的 值 。 

ASCII 十 进 制 数 每 个 字 节 存放 一 个 数字 ， 并 编码 为 ASCII 形式 。AAA (加 法 后 的 ASCII 
调整 ) 指令 将 ADD 或 ADC 指令 的 二 进 制 结果 转换 为 ASCII 十 进 制 。AAS (减法 后 的 ASCII 
调整 ) 指令 将 SUB 或 SBB 指令 的 二 进 制 结果 转换 为 ASCII 十 进 制 。 所 有 这 些 指令 都 只 能 用 
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于 32 位 模式 。 

非 压缩 十 进 制 数 每 个 字 节 存放 一 个 十 进 制 数字 ， 表 现 为 二 进 制 数值 。AAM (乘法 后 的 
ASCII 调整 ) 指令 转换 的 是 MUL 指令 执行 非 压缩 十 进 制 数 乘法 所 生成 的 二 进 制 结果 。AAD 
(除法 前 的 ASCII 调整 ) 指令 在 执行 DIV 指令 之 前 ,将 非 压缩 十 进 制 被 除数 转换 为 二 进 制 。 
所 有 这 些 指令 都 只 能 用 于 32 位 模式 。 

压缩 十 进 制 数 每 个 字 节 存放 两 个 十 进 制 数字 。DAA (加 法 后 的 十 进 制 调整 ) 指令 转换 的 
是 ADD 或 ADC 指令 执行 压缩 十 进 制 加 法 所 生成 的 二 进 制 结果 。DAS( 减 法 后 的 十 进 制 调整 ) 
间 令 转换 的 是 SUB 或 SBB 指令 执行 压缩 十 进 制 减法 所 生成 的 二 进 制 结果 。 所 有 这 些 指令 都 
只 能 用 于 32 位 模式 。 


7.8 关键 术语 

7.8.1 术语 

arithmetic shift (算术 移 位 ) divide overflow〔( 除 法 溢出 ) 

binary multiplication (二 进 制 乘法 ) little-endian order (小 端 顺序 ) 

bit rotation (位 循环 ) logical shift (逻辑 移 位 ) 

bit shifting (位 移 ) sign extension (符号 扩展 ) 

bit string (位 串 ) signed division (有 符号 除法 ) 

bitwise division (位 元 除法 ) signed multiplication (有 符号 乘法 ) 
bitwise muktiplication (位 元 乘法 ) signed overflow (有 符号 溢出 ) 
bitwise rotation (位 元 循环 ) unsigned multiplication (无 符号 乘法 ) 


7.8.2 指令、 运算 符 和 伪 指 令 


AAA AAS CBW 
AAD ADC DAA 
AAM CBQ DAS 
DIV RCR SBB 
IDIV ROL SHL 
IMUL ROR SHLD 
MUL SAL SHR 
RCL SAR SHRD 


7.9 复习 题 和 练习 


7.9.1 简 答题 
1. 有 如 下 代码 序列 ， 请 写 出 每 条 移 位 或 循环 移 位 指令 执行 后 AL 的 值 : 


mov al,0D4h 


SHE alsl -如 过 
mov al,0D4h 
Sar al,l -共生 


mov al,0D4h 
sar al,4 a 
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mov al,0D4h 


EOQl Bl,1 


2. 有 如 下 代码 序列 ， 请 写 出 每 条 移 位 或 循环 移 位 指令 执行 后 AL 的 值 : 


mov al,，0D4h 
wo 流 Ly 汝 


2 a。 
mov al,0D4h 
EOL Mi ys 
stc 
mov al,0D4h 
rel al,l ? 
stc 
mov al,0D4h 
re LS 87 本 


3. 执行 如 下 操作 后 ，AX 与 DX 的 内 容 是 什么 ? 


mov dx,0 
mov ax,222h 
mov cx,100h 
mul cx 


4. 执行 如 下 操作 后 ，AX 的 内 容 是 什么 ? 


mov ax,63h 
mov bl,10h 
div bl 


5. 执行 如 下 操作 后 ，EAX 和 EDX 的 内 容 是 什么 ? 


mov eax,123400h 
mov edx,0 

mov ebx,10h 

div ebx 


6. 执行 如 下 操作 后 ，AX 和 DX 的 内 容 是 什么 ? 


mov ax,4000h 
mov dx,500h 
mov bx,10h 
div bx 


7. 执行 如 下 操作 后 ，BX 的 内 容 是 什么 ? 


mov bx,5 
stc 

mov ax,60h 
adc bx,ax 


8. 在 64 位 模式 下 执行 下 述 代 码 并 描述 其 输出 : 


.data 

dividend hi QWORD 00000108h 
dividend lo QWORD 33300020h 
divisor QWORD 00000100h 
.Code 

mov rdx,dividend hi 

mov rax,dividend lo 

div divisor 


9. 下 面 的 程序 执行 的 是 val1 减 去 val2， 找 出 并 纠正 其 中 所 有 的 逻辑 错误 (CLC 清除 进位 标志 位 ): 


.data 
vall QWORD 20403004362047A1lh 


281 


224 盆 7 童 


val2 QWORD 055210304A2630B2h 
result QWORD 0 


.Code 
mov cx,8 ; 循环 计数 器 
mov esi,vall ; 设置 开始 索引 
mov edi,val2 
clc ; 清除 进位 标志 位 
top: 
mov al,BYTE PTR[esi] ; 取 第 一 个 数 
sbb al,BYTE PTR[edi] ; 减 去 第 二 个 数 
mov BYTE PTR[esi],al ; 保存 结果 
dec esi 
dec edi 
loop top 


10. 在 64 位 模式 下 执行 下 述 指令 后 ，RAX 中 的 十 六 进 制 内 容 是 什么 ? 
.data 
multiplicand QWORD 0001020304050000h 
.Code 
imul rax,multiplicand, 4 


7.9.2 算法 基础 


1. 编写 一 个 移 位 指令 序列 ,使 得 AX 符号 扩展 到 EAX。 也 就 是 说 ， 把 AX 的 符号 位 复制 到 EAX 的 高 16 位 。 不 要 
282 使 用 CWD 指令 。 

2. 假设 指令 集 没有 循环 移 位 指令 ， 请 说 明 如 何 用 SHR 和 条 件 判断 指令 将 AL 循环 右 移 一 位 。 

3. 编写 一 条 逻辑 移 位 指令 ， 实 现 EAX 乘 以 16。 

4. 编写 一 条 逻辑 移 位 指令 . 实现 EBX 除 以 4。 

5. 编写 一 条 循环 移 位 指令 ， 交 换 DL 寄存 器 的 高 4 位 和 低 4 位 。 

6. 编写 一 条 SHLD 指令 ， 把 AX 寄存 器 的 最 高 位 移 人 DX 的 最 低位 ， 并 把 DX 左 移 一 位 。 

7. 编写 指令 序列 ， 把 三 个 内 存 字 节 右 移 一 位 ， 使 用 数据 如 下 : 


byteArray BYTE 81h,20h,33h 





8. 编写 指令 序列 ， 把 三 个 内 存 字 节 左 移 一 位 ， 使 用 数据 如 下 : 
wordArray WORD 810Dh, 0C064h,93ABh 
9. 编写 指令 ， 实 现 -5 乘 以 3， 并 把 结果 存 人 一 个 16 位 变量 val1。 


10. 编写 指令 ， 实 现 -276 除 以 10， 并 把 结果 存 和 人 一 个 16 位 变量 val1。 
11. 使 用 32 位 无 符号 操作 数 ， 用 汇编 语言 实现 下 述 C++ 表达 式 : 


vall = (val2 * val3) / (val4 = 3) 
12. 使 用 32 位 有 符号 操作 数 ， 用 汇编 语言 实现 下 述 C++ 表达 式 : 
vall = (val2 / val3) * (vall + val2) 
13. 编写 一 个 过 程 ， 把 8 位 无 符号 二 进 制 数值 显示 为 十 进 制 形式 。 用 AL 接收 二 进 制 数值 ， 其 取 值 范围 


为 十 进 制 的 0~ 99。 你 能 从 本 书 链接 库 中 调用 的 只 有 WriteChar。 过 程 应 包含 约 8 条 指令 。 调 用 示 
例如 下 : 


mov al,65 ; 取 值 范围 0 一 99 
call showDecimal8 
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14. 挑战 : 假设 两 个 未 知 的 ASCII 十 进 制 数 字 相 加 ， 其 结果 为 AX 的 值 是 0072h， 辅 助 进位 标志 位 置 1。 
用 Intel 64 和 IA-32 指令 集 参考 手册 来 判断 AAA 指令 会 产生 怎样 的 输出 ， 并 解释 其 原因 。 

15. 挑战 : 假设 给 定 n 和 > 的 值 ， 若 只 能 使 用 SUB、MOYV 和 AND 指令 ， 如 何 计算 x=n mod y。 其 中 n 
为 任意 32 位 无 符号 整数 ，y 为 2 的 寡 。 

16. 挑战 : 编写 代码 计算 EAX 寄存 器 中 有 符号 整数 的 绝对 值 ， 要 求 只 能 使 用 SAR、ADD 和 XOR 指令 
(不 能 使 用 有 条 件 跳 转 ) 。 提 示 : 一 个 数 加 -1 可 取 反 ， 然 后 形成 其 反 码 。 同 时 ， 如 果 一 个 数 与 全 1 
进行 XOR 运算 ， 则 其 为 1 的 位 取 反 。 也 就 是 说 ， 如 果 与 全 0 进行 XOR 运算 ， 则 该 数 不 变 。 


7.10 编程 练习 


*1. 显示 ASCII 十 进 制 数 
编写 名 为 WriteScaled 的 过 程 ， 输 出 有 隐 含 十 进 制 小 数 点 的 ASCII 十 进 制 数 。 假 设 数 据 定义 
如 下 ， 其 中 DECIMAL_OFFSET 表示 的 是 十 进 制 小 数 点 必须 在 数据 右 起 第 5 位 上 : 


DECIMAL OFFSET = 5 
.data 
decimal one BYTE "100123456789765" 


WrireSclaed 输出 数据 如 下 所 示 : 
1001234567.89765 


调用 WrireSclaed 时 ，EDX 为 数 的 偏 移 量 ，ECX 为 数 的 长 度 ，EBX 为 小 数 点 偏 移 量 ， 编 写 测 
试 程序 ， 向 WriteSclaed 过 程 传递 三 个 不 同 大 小 的 数 。 
* 2. 扩展 减法 过 程 
编写 名 为 Extended_Sub 的 过 程 ， 实 现任 意 大 小 的 两 个 二 进 制 数 减法 。 这 两 个 数 需要 有 同样 
大 小 的 存储 空间 ， 且 其 大 小 应 为 32 位 的 倍数 。 编 写 测试 程序 向 该 过 程 传递 不 同 的 整数 对 ， 每 个 数 
至 少 长 10 个 字 节 。 
** 3,. 压缩 十 进 制 转换 
编写 名 为 PackedToAsc 的 过 程 ， 将 4 字 节 的 压缩 十 进 制 整数 转换 为 ASCII 十 进 制 数字 串 。 向 
过 程 传递 压缩 整数 和 存放 ASCII 数字 的 缓冲 区 地 址 。 编 写 一 个 简短 的 程序 测试 该 过 程 ， 至 少 使 用 5 
个 压缩 十 进 制 整 数 作为 测试 数据 。 
xx*4. 用 循环 移 位 操作 进行 加 密 
编写 一 个 过 程 ， 通 过 将 明文 的 每 个 字 节 向 不 同方 向 循环 移动 不 同 的 位 数 来 对 其 进行 简单 加 密 。 
例如 ， 下 面 的 数组 就 表示 一 个 密 钥 ， 负 数 代表 循环 左 移 ， 正 数 代 表 循 环 右 移 。 其 中 的 每 个 整数 表示 
的 是 循环 移动 的 位 数 : 


Rey BYTE. 二 2 dr Tr OF 3 


该 过 程 应 将 消息 明文 进行 循环 ， 把 密 钥 分 配给 消息 的 前 10 个 字 节 。 明 文 的 每 个 字 节 循环 移动 
的 位 数 由 其 对 应 的 密 钥 值 来 决定 。 然 后 再 把 密 钥 分 配给 消息 的 下 一 组 10 个 字 节 ， 并 重复 前 述 过 程 。 
编写 测试 程序 ， 用 两 组 不 同 的 数据 集 调 用 加 密 过 程 两 次 ， 以 对 其 进行 测试 。 
wx 5. 素数 
编写 程序 ， 使 用 厄 拉 多 塞 过 滤 算 法 (Sieve of Eratosthenes) 生成 2 ~ 1000 之 间 的 全 部 素数 。 
互联 网 上 可 以 发 现 很 多 文章 描述 了 使 用 该 算法 寻找 素数 的 方法 。 要 求 显示 所 有 的 素数 。 
***6. 最 大 公约 数 (GCD ) 
两 个 数 的 最 大 公约 数 ( GCD) 是 指 能 整除 这 两 个 数 的 最 大 整数 。 下 述 伪 代码 描述 的 是 循环 整数 
除法 的 GCD 算法 : 
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int GCD(int x, int y) 
x = abs(x) // 绝对 值 
y = abs(y) 
do { 
int nsey 
基于 
Y=n 
} while (y > 0) 
return x 


用 汇编 语言 实现 该 函数 ， 并 编写 测试 程序 ， 通 过 向 该 函数 传递 不 同 的 数值 对 其 进行 多 次 调用 。 
在 屏幕 上 显示 全 部 结果 。 
xx 7. 位 元 乘法 
编写 名 为 BitwiseMultiply 的 过 程 ， 仅 使 用 移 位 和 加 法 ， 实 现任 意 32 位 无 符号 数 与 EAX 相 乘 。 
过 程 用 EBX 寄存 器 传递 乘 数 ， 用 EAX 寄存 器 传递 返回 值 。 编 写 简单 的 测试 程序 ， 调 用 过 程 并 显示 
乘积 。( 假 设 乘积 不 会 超过 32 位 。) 编写 该 程序 具有 相当 的 挑战 性 。 一 种 可 能 的 方法 是 用 循环 结构 右 
移 乘 数 ， 记 录 在 进位 标志 位 被 置 1 之 前 移动 的 位 数 。 然 后 把 这 个 位 数 用 到 SHL 指令 中 ， 被 乘 数 作 
为 该 指令 的 目的 操作 数 。 重 复 该 过 程 ， 直 到 乘 数 最 后 一 个 为 1 的 位 。 
*## 8. 压缩 整数 加 法 
扩展 7.6.1 节 的 AddPacked 过 程 ， 使 其 实现 两 个 任意 大 小 (但 其 长 度 必须 相同 ) 的 压缩 十 进 制 
数 加 法 。 编 写 测试 程序 ， 向 AddPacked 传送 几 组 整数 : 4 字 节 的 、8 字 节 的 和 16 字 节 的 。 假 设 该 过 
程 使 用 如 下 寄存 器 传递 参数 : 
ESI 一 一 第 一 个 数 的 指针 
EDI 一 一 第 二 个 数 的 指针 
EDX 一 一 和 数 指针 
285 ECX 一 一 相 加 的 字 节 数 
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8.1 引言 


本 章 将 介绍 子 程序 调用 的 底层 结构 ， 重 点 集中 于 运行 时 堆栈 。 本 章 的 内 容 对 C 和 C++ 
程序 员 也 是 有 价值 的 ， 因 为 在 调试 运行 于 操作 系统 或 设备 驱动 程序 层 的 底层 子 程序 时 ， 他 们 
也 经 常 必须 检查 运行 时 堆栈 的 内 容 。 

大 多 数 现代 编程 语言 在 调用 子 程序 之 前 都 会 把 参数 压 人 堆栈 。 反 过 来 ， 子 程序 也 常常 把 
它们 的 局 部 变量 压 人 堆栈 。 本 章 学 习 的 详细 内 容 与 CH+ 和 Java 知识 相关 ， 将 展示 如 何以 数值 
或 引用 的 形式 来 传递 参数 ; 如 何 定义 和 撤销 局 部 变量 ; 以 及 如 何 实现 递归 。 在 本 章 结束 时 ， 将 
解释 MASM 使 用 的 不 同 的 内 存 模 式 和 语言 标识 符 。 参 数 既 可 以 用 寄存 器 传递 也 可 以 用 堆栈 传 
递 。 这 就 是 64 位 模式 下 的 情况 ，Microsoft 发 布 的 Microsoft x64 调用 规范 中 就 是 这 样 规定 的 。 

编程 语言 用 不 同 的 术语 来 指 代 子 程序 。 例 如 ， 在 C 和 C++ 中 ， 子 程序 被 称 为 函 
数 (functions)。 在 Java 中 ， 被 称 为 方法 (methods)。 在 MASM 中 ， 则 被 称 为 过 程 
(procedures)。 本 章 目的 是 说 明 典型 子 程序 调用 的 底层 实现 ， 就 像 它 们 在 C 和 C++ 中 展现 的 
那样 。 在 本 章 开 始 提 到 一 般 原 则 时 ， 将 使 用 泛称 : 子 程序 。 而 在 提 到 具体 汇编 语言 代码 示例 
时 ， 通 常会 使 用 术语 过 程 来 指 代 子 程序 。 

调用 程序 向 子 程序 传递 的 数值 被 称 为 实际 参数 9 (arguments)。 而 被 调用 的 子 程序 要 接收 
的 数值 被 称 为 形式 参数 (parameters ) 。 


8.2 堆栈 帧 


8.2.1 堆栈 参数 


在 之 前 的 章节 中 ， 子 程序 接收 的 是 寄存 器 参数 。 比 如 在 Irvine32 链接 库 中 就 是 如 此 。 本 
章 将 展示 子 程序 如 何 用 堆栈 接收 参数 。 在 32 位 模式 下 ， 堆 栈 参 数 总 是 由 Windows API 函数 
使 用 。 然 而 在 64 位 模式 下 ，Windows 函数 可 以 同时 接收 寄存 器 参数 和 堆栈 参数 。 

堆栈 帧 (stack frame) (或 活动 记录 (activation record)) 是 一 块 堆栈 保留 区 域 ， 用 于 存放 
被 传递 的 实际 参数 、 子 程序 的 返回 值 、 局 部 变量 以 及 被 保存 的 寄存 器 。 堆 栈 帧 的 创建 步 又 如 
下 所 示 : 

1 ) 被 传递 的 实际 参数 。 如 果 有 ， 则 压 入 堆栈 。 

2 ) 当 子 程序 被 调用 时 ， 使 该 子 程序 的 返回 值 压 人 堆栈 。 

3 ) 子 程序 开始 执行 时 ，EBP 被 压 人 堆栈 。 

4) 设置 EBP 等 于 ESP。 从 这 时 开始 ，EBP 就 变 成 了 该 子 程序 所 有 参数 的 引用 基 址 。 

5 ) 如 果 有 局 部 变量 ， 修 改 ESP 以 便 在 堆栈 中 为 这 些 变量 预 留 空间 。 


怠 argument 通常 理解 为 实际 参数 ，parameter 理解 为 形式 参数 。 本 书 翻译 中 ， 在 不 影响 理解 的 情况 下 ， 都 译作 
参数 。 一 一 译 者 注 
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6 ) 如 果 需 要 保存 寄存 器 ， 就 将 它们 压 人 堆栈 。 

程序 内 存 模 式 和 对 参数 传递 规则 的 选择 直接 影响 到 堆栈 帧 的 结构 。 

学 习 用 堆栈 传递 参数 有 个 好 理由 : 几乎 所 有 的 高 级 语言 都 会 用 到 它们 。 比 如 ， 如 果 想 要 
在 32 位 Windows 应 用 程序 接口 (API) 中 调用 函数 ， 就 必须 用 堆栈 传递 参数 。 而 64 位 程序 
可 以 使 用 另 一 种 不 同 的 参数 传递 规则 ， 该 规则 将 在 第 11 章 讨 论 。 


8.2.2 寄存 器 参数 的 缺点 


多 年 以 来 ， Microsoft 在 32 位 程序 中 包含 了 一 种 参数 传递 规则 ， 称 为 fastcall。 如 同 这 
个 名 字 所 暗示 的 ， 只 需 简 单 地 在 调用 子 程序 之 前 把 参数 送 入 寄存 器 ， 就 可 以 将 运行 效率 提高 
一 些 。 相 反 ， 如 果 把 参数 压 人 堆栈 ， 则 执行 速度 就 要 更 慢 一 点 。 典 型 用 于 参数 的 寄存 器 包括 
EAX、EBX、ECX 和 EDX， 少 数 情 况 下 ， 还 会 使 用 EDI 和 ESI。 可 惜 的 是 ， 这 些 寄存 器 在 
用 于 存放 数据 的 同时 ， 还 用 于 存放 循环 计数 值 以 及 参与 计算 的 操作 数 。 因 此 ， 在 过 程 调用 之 
前 ， 任 何 存放 参数 的 寄存 器 须 首先 人 栈 ， 然 后 向 其 分 配 过 程 参 数 ， 在 过 程 返回 后 再 恢复 其 原 
始 值 。 例 如 ， 如 下 代码 从 Irvine32 链接 库 中 调用 了 DumpMem: 

push ebx ; 保存 霖 存 器 值 


push ecx 

push esi 

mov esi,OFFSET array  ; 初始 OFFSET 

mov ecx,LENGTHOF array ; 大 小 ， 按 元 素 个 数 计 


mov ebx,TYPE array ; 双 字 格式 
call DumpMem ; 显示 内 存 
pop esi ; 恢复 寄存 器 值 
pop ecx 

pop ebx 


这 些 额 外 的 入 栈 和 出 栈 操作 不 仅 会 让 代码 混乱 ,还 有 可 能 消除 性 能 优势 ， 而 这 些 优 势 
正 是 通过 使 用 寄存 器 参数 所 期 望 获得 的 ! 此 外 ， 程 序 员 还 要 非常 仔细 地 将 PUSH 与 相应 的 
POP 进行 匹配 ， 即 使 代码 存在 着 多 个 执行 路 径 。 例 如 ， 在 下 面 的 代码 中 ,第 8 行 的 EAX 如 
果 等 于 1， 那 么 过 程 在 第 17 行 就 无 法 返回 其 调用 者 ， 原 因 就 是 有 三 个 寄存 器 的 值 留 在 运行 
时 堆栈 里 


1: push ebx 7 保存 寄存 器 值 
2: push ecx 
3: push esi 
4: mov “esi,OFFSET array ;初始 OFFSET 
5: mov ecx,LENGTHOF array ; 大 小 ， 按 元 素 个 数 计 
6: mov ebx,TYPE array ; 双 字 格式 
7: call DumpMem ; 显示 内 存 
8: cmp eax,l ; 设置 错误 标志 ? 
9: je error exit ; 设置 标志 后 退出 
10% 
ll: pop esi ; 恢复 寄存 器 值 


12: pop eCX 

13: pop ebx 

14: ret 

15: error exit: 

16: mov edx,offset error msg 
Fs Tet 


不 得 不 说 , 像 这 样 的 错误 是 不 容易 发 现 的 ， 除 非 是 花 了 相当 多 的 时 间 来 检查 代码 。 
堆栈 参数 提供 了 一 种 不 同 于 寄存 器 参数 的 灵活 方法 : 只 需要 在 调用 子 程序 之 前 ， 将 参 
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数 压 人 堆栈 即 可 。 比 如 ， 如 果 DumpMem 使 用 了 堆栈 参数 ， 就 可 以 通过 如 下 代码 对 其 进行 
调用 : 

push TYPE array 

push LENGTHOF array 


push OFFSET array 
call DumpMem 


子 程 序 调 用 时 ， 有 两 种 常见 类 型 的 参数 会 人 栈 : 

e 值 参 数 (变量 和 常量 的 值 ) 

e 引用 参数 (变量 的 地 址 ) 

值 传递 ” 当 一 个 参数 通过 数值 传递 时 ， 该 值 的 副本 会 被 压 和 堆栈。 假设 调用 一 个 名 为 
AddTwo 的 子 程序 ， 向 其 传递 两 个 32 位 整数 : 


-data 

vall DWORD 5 
val2 DWORD 6 
.Code 

push val2 
push vall 
call AddTwo 


执行 CALL 指令 前 ,堆栈 如 下 图 所 示 : 





用 C++ 编写 相同 的 功能 调用 则 为 

int sum = RddTwol vall, val2 ); 

观察 发 现 参数 入 栈 的 顺序 是 相反 的 ， 这 是 C 和 C++ 语言 的 规范 。 

引用 传递 ”通过 引用 来 传递 的 参数 包含 的 是 对 象 的 地 址 ( 偏 移 量 )。 下 面 的 语句 调用 了 
Swap， 并 传递 了 两 个 引用 参数 : 


push OFFSET val2 
push OFFSET vall 
call Swap 


调用 Swap 之 前 ,堆栈 如 下 图 所 示 : 


四 <— ESP 





在 C/C++ 中， 同样 的 函数 调用 将 传递 vall 和 val2 参数 的 地 址 : 


Swap( &vall, &val2 ); 


传递 数组 ”高 级 语言 总 是 通过 引用 向 子 程序 传递 数组 。 也 就 是 说 ， 它 们 把 数组 的 地 址 压 
人 堆栈 。 然 后 ， 子 程序 从 堆栈 获得 该 地 址 ， 并 用 其 访问 数组 。 不 愿意 用 值 来 传递 数组 的 原因 是 
显而易见 的 ， 因 为 这 样 就 会 要 求 将 每 个 数组 元 素 分 别 压 人 堆栈 。 这 种 操作 不 仅 速度 很 慢 ， 而 
且 会 耗 尽 宝贵 的 堆栈 空间 。 下 面 的 语句 用 正确 的 方法 向 子 程序 ArrayFill 传递 了 数组 的 偏 移 量 : 
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data 

array DWORD 50 DUP(?) 
Code 

push OFFSET array 
call ArrayFill 


8.2.3 访问 堆栈 参数 


高 级 语言 有 多 种 方式 来 对 函数 调用 的 参数 进行 初始 化 和 访问 。 以 C 和 C++ 语言 为 例 ， 
它们 以 保存 EBP 寄存 器 并 使 该 寄存 器 指向 栈 顶 的 语句 为 开始 (prologue)。 然 后 ， 根 据 实 际 
情况 ， 它 们 可 以 把 某 些 寄 存 器 人 栈 ， 以 便 在 函数 返回 时 恢复 这 些 寄 存 器 的 值 。 在 函数 结尾 
(epilogue) 部 分 ， 恢 复 EBP 寄存 器 ， 并 用 RET 指令 返回 调用 者 。 

AddTwo 示例 下 面 是 用 C 编写 的 AddTwo 函数 ， 它 接收 了 两 个 值 传递 的 整数 ， 然 后 返 
回 这 两 个 数 之 和 : 


int AddTwo( int x, int y ) 
{ 
return x + y; 


} 


现在 用 汇编 语言 实现 同样 的 功能 。 在 函数 开始 的 时 候 ，AddTwo 将 EBP 入 栈 ， 以 保存 其 
当前 值 : 


AddTwo PROC 
push ebp 


接 下 来 ，EBP 的 值 被 设置 为 等 于 ESP， 这 样 EBP 就 成 为 AddTwo 堆栈 帧 的 基 址 指针 : 
AddTwo PROC 
push ebp 
mov ebp,esp . 
执行 了 上 面 两 条 指令 后 ， 堆 栈 帧 的 内 容 如 下 图 所 示 。 而 形 如 AddTwo (5，6 ) 的 函数 调 
用 会 先 把 第 一 个 参数 入 栈 ， 再 把 第 二 个 参数 人 栈 : 





的 是 ESP， 而 EBP 则 不 会 。 

基 址 - 偏 移 量 寻 址 ”可 以 使 用 基 址 - 偏 移 量 寻 址 (base-offset addressing) 方式 来 访问 堆 
栈 参数 。 其 中 ，EBP 是 基 址 寄存 器 ， 偏 移 量 是 常数 。 通 常 ，EAX 为 32 位 返回 值 。AddTwo 
的 实现 如 下 所 示 ， 参 数 相 加 后 ，EAX 返回 它们 的 和 数 : 


AddTwo PROC 
push ebp 
mov ebp,esp ; 堆栈 帧 的 基 址 
mov eax, [ebpb + 12] ; 第 二 个 参数 
add eax,[ebp + 8] ;第 一 个 参数 
pop ebp 
ret 

AddTwo ENDP 
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1. 显 式 的 堆栈 参数 

车 堆栈 参数 的 引用 表达 式 形 如 [ebp+8]， 则 称 它 们 为 显 式 的 堆栈 参数 (explicit stack 
parameters) 。 这 个 名 称 的 含义 是 : 汇编 代码 显 式 地 说 明了 参数 的 偏 移 量 是 一 个 常数 。 有 些 程 
序 员 定义 符号 常量 来 表示 显 式 的 堆栈 参数 ， 以 使 其 代码 更 具 易 读 性 : 


Y_pParam EQU [ebp + 12] 
x_ param EQU [ebp + 8] 


AddTwo PROC 
push ebp 
mov ebp,esp 
mov eax,y_param 
add eax,x param 





pop ebp 

ret 
AddTwo ENDP 291 
2. 清除 堆栈 


子 程序 返回 时 ， 必 须 将 参数 从 堆栈 中 删除 。 否 则 将 导致 内 存 泄露 ， 堆 栈 就 会 被 破坏 。 例 


如 ， 设 如 下 语句 在 main 中 调用 AddTwo: 
push 6 
push 5 


call AddTwo 


假设 AddTwo 有 两 个 参数 留 着 堆栈 中 ， 下 图 所 示 为 调用 返回 后 的 堆栈 : 





| <—EsP 


main 部 分 试图 忽略 这 个 问题 ， 并 希望 程序 能 正常 结束 。 但 是 ， 如 果 循 环 调用 AddTwo， 
堆栈 就 会 溢出 。 因 为 每 次 调用 都 会 占用 12 字 节 的 堆栈 空间 一 一 每 个 参数 需要 4 个 字 节 ， 再 
加 4 个 字 节 留 给 CALL 指令 的 返回 地 址 。 如 果 在 main 中 调用 Examplel， 而 它 又 要 调用 
AddTwo 就 会 导致 更 加 严重 的 问题 : 


main PROC 
call Examplel 
exit 

main ENDP 





Examplel PROC 
push 6 
push 5 
call AddTwo 
ret ; 堆栈 被 破坏 了 ! 


Examplel ENDP 


当 Examplel 的 RET 指令 将 要 执行 时 ，ESP 指向 整数 5 而 不 是 能 将 其 带 回 main 的 返回 
地 址 : 





用 < 一 ESP 


RET 指令 把 整数 5 加 载 到 指令 指针 寄存 器 ， 尝 试 将 控制 转移 到 内 存 地 址 为 5 的 位 置 。 
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232 盆 8 总 


假设 这 个 地 址 在 程序 代码 边界 之 外 ,那么 处 理 器 将 给 出 运行 时 异常 ， 通 知 OS 终止 程序 。 
8.2.4 32 位 调用 规范 


本 节 将 给 出 Windows 环境 中 两 种 最 常用 的 32 位 编程 调用 规范 。 首 先是 C 语言 发 布 的 
C 调用 规范 ， 该 语言 用 于 Unix 和 Windows。 然 后 是 STDCALL 调用 规范 ， 它 描述 了 调用 
Windows API 函数 的 协议 : 这 两 种 规范 都 很 重要 ， 因 为 在 C 和 C++ 程序 中 会 调用 汇编 函数 ， 
同时 汇编 语言 程序 也 会 调用 大 量 的 Windows API 函数 。 

C 调用 规范 C 调用 规范 用 于 C 和 C++ 语言 。 子 程序 的 参数 按 道 序 人 栈 ， 因 此 ，C 程 
序 在 调用 如 下 函数 时 ， 先 将 B 入 栈 ， 再 将 A 人 栈 : 


AddTwol( A, B ) 


C 调用 规范 用 一 种 简单 的 方法 解决 了 清除 运行 时 堆栈 的 问题 ， 程序 调用 子 程序 时 ， 在 
CALL 指令 的 后 面 紧 跟 一 条 语句 使 堆栈 指针 (ESP) 加 上 一 个 数 ， 该 数 的 值 即 为 子 程序 参数 
所 占 堆栈 空间 的 总 和 。 下 面 的 例子 在 执行 CALL 指令 之 前 ， 将 两 个 参数 (5 和 6 ) 人 栈 : 

Examplel PROC 

push 6 

push 5 

call AddTwo 

add ”esp,8 ;从 堆栈 移 除 参数 
ret 

Examplel ENDP 


因此 ， 用 C/C++ 编写 的 程序 在 从 子 程序 返回 后 ， 总 是 能 把 参数 从 堆栈 中 删除 。 
STDCALL 调用 规范 另 一 种 从 堆栈 删除 参数 的 常用 方法 是 使 用 名 为 STDCALL 的 规 
范 。 如 下 所 示 的 AddTwo 过 程 给 RET 指令 添加 了 一 个 整数 参数 ， 这 使 得 程序 在 返回 到 调用 
过 程 时 ，ESP 会 加 上 数值 8。 这 个 添加 的 整数 必须 与 被 调用 过 程 参 数 占 用 的 堆栈 空间 字 节 数 
相等 : 
AddTwo PROC 
push ebp 
mov ebp,esp ; 堆栈 帧 基 址 
mov eax,[ebp + 12] ; 第 二 个 参数 
add eax,[ebp + 8] ;第 一 个 参数 
pop ebp 
ret 8 ; 清除 堆栈 
AddTwo ENDP 
要 说 明 的 是 ，STDCALL 与 C 相似 ， 参 数 是 按 逆序 人 栈 的 。 通 过 在 RET 指令 中 添加 参 
数 ，STDCALL 不 仅 减 少 了 子 程序 调用 产生 的 代码 量 (减少 了 一 条 指令 )， 还 保证 了 调用 程序 
永远 不 会 忘记 清除 堆栈 。 另 一 方面 ，C 调用 规范 则 允许 子 程序 声明 不 同 数量 的 参数 ， 主 调 程 
序 可 以 决定 传递 多 少 个 参数 。C 语言 的 printf 函数 就 是 一 个 例子 ， 它 的 参数 数量 取决 于 初始 
字符 串 参 数 中 的 格式 说 明 符 的 个 数 : 
蕊 3 
float y = 3.2; 
Shar SS 
printf("Printing values: %d, ff, Sc", XK, Y, 2)» 


C 编译 器 按 逆序 将 参数 人 栈 ， 被 调用 的 函数 负责 确定 要 传递 的 实际 参数 的 个 数 ， 然 后 依 
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次 访问 参数 。 这 种 函数 实现 没有 像 给 RET 指令 添加 一 个 常数 那样 简便 的 方法 来 清除 堆栈 ， 
因此 ， 这 个 责任 就 留 给 了 主 调 程序 。 

调用 32 位 Windows API 函 数 时 ，Irvine32 链接 库 使 用 的 是 STDCALL 调 用 规范 。 
Irvine64 链接 库 使 用 的 是 x64 调用 规范 。 


从 这 里 开始 ， 本 书 假 设 所 有 过 程 示 例 使 用 的 都 是 STDCALL， 除 非 明确 说 明 使 用 了 


其 他 规范 。 


保存 和 恢复 寄存 器 

通常 ， 子 程序 在 修改 寄存 器 之 前 要 将 它们 的 当前 值 保存 到 堆栈 。 这 是 一 个 很 好 的 做 法 ， 
因为 可 以 在 子 程序 返回 之 前 恢复 寄存 器 的 原始 值 。 理 想 情况 下 ， 相关 寄 存 器 入 栈 应 在 设置 
EBP 等 于 ESP 之 后 ， 在 为 局 部 变量 保留 空间 之 前 。 这 有 利于 避免 修改 当前 堆栈 参数 的 偏 移 
量 。 例 如 ， 假 设 如 下 过 程 MySub 有 一 个 堆栈 参数 。 在 EBP 被 设置 为 堆栈 帧 基 址 后 ，ECX 和 
EDX 和 人 栈 ， 然 后 堆栈 参数 加 载 到 EAX : 





MySub PROC 
push ebp ; 保存 基 址 指针 
mov ebp,esp ; 堆栈 帧 基 址 
push ecx 
push edx ; 保存 EDX 


mov eax,1ebp+8] ; 取 推 栈 参 数 


BoB ed ; 恢复 被 保存 的 寄存 器 







pop ecx 
pop ebp ; 恢复 基 址 指针 
ret ; 清除 堆栈 
MySub ENDP 
EBP 被 初始 化 后 ， 在 整个 过 程 期 间 它 的 值 将 保持 不 变 。 [多 数 ”由 spp 
ECX 和 EDX 的 和 人 栈 不 会 影响 到 已 人 栈 参数 与 EBP 之 间 的 位 移 [EBP44] 
量 ， 因 为 堆栈 的 增长 位 于 EBP 的 下 方 (如 图 8-1 所 示 )。 | Esp ||<—EeP 
| ecx 
8.2.5 ”局 部 变量 | EDXx 问 <—Esp 


高 级 语言 中 ， 在 单一 子 程序 内 新 建 、 使 用 和 撤销 的 变量 被 
称 为 局 部 变量 (local variable)。 局 部 变量 创建 于 运行 时 堆栈 ， 
通常 位 于 基 址 指针 ( EBP) 之 下 。 尽 管 不 能 在 汇编 时 给 它们 分 配 默认 值 ， 但 是 能 在 运行 时 初 
始 化 它们 。 可 以 使 用 与 C 和 C++ 相同 的 方法 在 汇编 语言 中 新 建 局 部 变量 。 

示例 下 面 的 C++ 函数 声明 了 局 部 变量 X 和 YY: 


void MySub!() 
{ 
4 
iH 芝 
} 


如 果 这 段 代 码 被 编译 为 机 器 语言 ， 就 能 看 出 局 部 变量 是 如 何 分 配 的 。 每 个 堆栈 项 都 默认 
为 32 位 ， 因 此 ， 每 个 变量 的 存储 大 小 都 要 向 上 取 整 保存 为 4 的 倍数 。 两 个 局 部 变量 一 共 要 
保留 8 个 字 节 


图 8-1 MySub 过 程 的 堆栈 帧 


10} 
20; 
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变量 堆栈 偏 移 量 
2 
MySub 函数 (在 调试 器 中 ) 的 反 汇 编 展 示 了 C++ 程序 如 何 创 建 局 部 变量 ， 以 及 如 何 从 
堆栈 中 删除 它们 。 该 例 使 用 了 C 调用 规则 : 


MySub PROC 
push ebp 
mov ebp,esp 

795 sub esp,8 ; 创建 局 部 变量 
mov DWORD PTR [ebp—4],10 二 
mov DWORD PTR [ebp-8],20 Ee 
mov esp,ebp ; 从 堆栈 中 删除 局 部 变量 
pop ebp 
ret 
MySub ENDP 


局 部 变量 初始 化 后 ， 函 数 的 堆栈 帧 如 图 8-2 所 示 。 

在 结束 前 ， 函 数 通过 将 EBP 的 值 赋 给 堆栈 指针 完 
成 对 其 的 重 置 ， 该 操作 的 效果 是 把 局 部 变量 从 堆栈 中 
删除 : 


mov esp,ebp ; 从 堆栈 中 删除 局 部 变量 图 8-2 创建 局 部 变量 后 的 堆栈 帧 


如 果 省 略 这 一 步 ， 那 么 POP EBP 指令 将 会 把 EBP 设置 为 20， 而 RET 指令 就 会 分 支 到 
内 存 地 址 10 的 位 置 ， 从 而 导致 程序 因 出 现 处 理 器 异常 而 终止 。 下 面 的 MySub 代码 就 是 这 种 


<— EBP 
[EBP-4] 


中 [EBP-8] <—ESsP 





情况 : 
MySub PROC 
push ebp 
mov ebp,esp 
sub esp,8 ; 创建 局 部 变量 
mov DWORD PTR [ebp—4],10 2 洲 
mov DWORD PTR [ebp 一 8],20 ;YY 
Pop ebp 
ret ; 返回 到 无 效 地 址 ! 
MySub ENDP 
局 部 变量 符号 ”为 了 使 程序 更 加 易 读 ， 可 以 为 每 个 局 部 变量 的 偏 移 量 定义 一 个 符号 ， 然 
后 在 代码 中 使 用 这 些 符号 : 


X local EQU DWORD PTR [ebp—4] 
Y local EQU DWORD PTR [ebp-8] 


MySub PROC 
push ebp 
mov ebp,esp 
sub esp,8 ; 为 局 部 变量 保留 空间 
mov Xx local,10 六 下 
mov YY local,20 
mov espi,ebp ; 从 堆栈 中 删除 局 部 变量 
Pop ebp 


ret 


MySub ENDP 


高 级 过 程 235 





8.2.6 引用 参数 


引用 参数 通常 是 由 过 程 用 基 址 - 偏 移 量 寻 址 (从 EBP) 方式 进行 访问 。 由 于 每 个 引用 
参数 都 是 一 个 指针 ， 因 此 ， 常 常 作 为 一 个 间接 操作 数 放 在 寄存 器 中 。 例 如 ， 假 设 堆栈 地 址 
[ebp+12] 存放 了 一 个 数组 指针 ， 则 下 述 语 句 就 把 该 指针 复制 到 ESP 中 : 


mov esi,[ebp+12] ; 指向 数组 


ArrayFil 示例 下 面 将 要 展示 的 ArrayFill 过 程 用 16 位 整数 的 伪 随 机 序列 来 填充 数组 。 它 
接收 两 个 参数 : 数组 指针 和 数组 长 度 ， 第 一 个 为 引用 传递 ， 第 二 个 为 值 传递 。 调 用 示例 如 下 : 

-data 

count = 100 

array WORD count DUP(?) 

.code 

push OFFSET array 

push count 

call ArrayFill 


在 ArrayFill 中 ， 下 面 的 代码 为 其 开始 部 分 ， 对 堆栈 帧 指针 (EBP) 进行 初始 化 : 


ArrayFill PROC 
push ebp 
mov ebp,esp 


现在 ,堆栈 帧 中 包含 了 数组 偏 移 量 、 数 组 长 度 (count)、 返 回 地 址 以 及 被 保存 的 EBP: 


\|[EBP+12] 
[EBP+8] 





EN 


ArrayFill 保存 了 通用 寄存 器 ， 检 索 参 数 并 填充 数组 : 


ArrayFill PROC 
push ebp 
mov ebp,esp 
pushad ;? 保存 寄存 器 
mov esi, [ebp+12] ;数组 偏 移 量 
mov ecx,[ebp+8] ;数组 长 度 
cmp ecx,0 ;ECX==0 ? 


je 上 ; 是 : 跳 过 循环 

Ll1: 
mov eax,10000h ; 随机 范围 0 ~ FFFFh 
call RandomRange  ; 从 链接 库 生成 随机 数 
mov [esi],ax ; 在 数组 中 插入 值 
add esi,TYPE WORD ; 指向 下 一 个 元 素 
loop Ll1 

L2: popad ;恢复 寄存 器 
pop ebp 
ret 8 ; 清除 堆栈 


ArrayFill ENDP 


8.2.7 LEA 指令 
LEA 指令 返回 间接 操作 数 的 地 址 。 由 于 间接 操作 数 中 包含 一 个 或 多 个 寄存 器 ， 因 此 会 
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在 运行 时 计算 这 些 操作 数 的 偏 移 量 。 为 了 演示 如 何 使 用 LEA， 现 在 来 看 下 面 的 C++ 程序 ， 
该 程序 声明 了 一 个 局 部 数组 myString， 并 引用 它 来 分 配 数组 值 : 
void makeRrray( ) 
{ 
char myString[30]; 
for( nt = 07 EE < 307 34 在] 
myString[i)] = "*'; 
} 


与 之 等 效 的 汇编 代码 在 堆栈 中 为 myString 分 配 空间 ， 并 将 地 址 一 一 间接 操作 数 一 一 赋 
给 ESI。 虽然 数 组 只 有 30 个 字 节 ， 但 是 ESP 还 是 递减 了 32 以 对 齐 双 字 边界 。 注 意 如 何 使 用 
LEA 把 数组 地 址 分 配给 ESI: 


makeArray PROC 


push ebp 
mov ebp,esp 
sub esp,32 imyString 位 于 EBP-30 的 位 置 
lea esi,[ebp—30] 7 加 载 myString 的 地 址 
mov ecx,30 ; 循环 计数 器 

Ll: mov BYTE PTR [esi],'*' ;填充 一 个 位 置 
inc esi 7 指向 下 一 个 元 素 
loop Ll ; 循环 、 直 到 ECX=0 
add esp,32 7 删除 数组 ( 恢复 ESP) 
pop ebp 
ret 


makeArray ENDP 


不 能 用 OFFSET 获得 堆栈 参数 的 地 址 ， 因 为 OFFSET 只 适用 于 编译 时 已 知 的 地 址 。 下 
面 的 语句 无 法 汇编 : 


mov esi,OFFSET [ebp—30] ;错误 


8.2.8 ENTER 和 LEAVE 指令 


ENTER 指令 为 被 调用 过 程 自动 创建 堆栈 帧 。 它 为 局 部 变量 保留 堆栈 空间 ， 把 EBP 人 
栈 。 具 体 来 说 ， 它 执行 三 个 操作 : 

e 把 EBP 人 栈 (push ebp) 

e 把 EBP 设置 为 堆栈 帧 的 基 址 (mov ebp，esp) 

e 为 局 部 变量 保留 空间 (sub esp, numbytes) 

ENTER 有 两 个 操作 数 : 第 一 个 是 常数 ， 定 义 为 局 部 变量 保存 的 堆栈 空间 字 节 数 ; 第 二 
个 定义 了 过 程 的 词法 艇 套 级 。 


ENTER numbytes, nestinglevel 


这 两 个 操作 数 都 是 立即 数 。Numbytes 总 是 向 上 舍 人 为 4 的 倍数 ， 以 便 ESP 对 齐 双 字 边 
界 。Nestinglevel 确定 了 从 主 调 过 程 堆栈 帧 复制 到 当前 帧 的 堆栈 帧 指针 的 个 数 。 在 示例 程序 
中 ，nestinglevel 总 是 为 0。Intel 手册 解释 了 ENTER 指令 如 何 支 持 模块 结构 语言 中 的 多 级 
艇 套 。 

示例 1 下 面 的 例子 声明 了 一 个 没有 局 部 变量 的 过 程 : 


MySub PROC 
enter 0,0 
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它 与 如 下 指令 等 效 : 


MySub PROC 
push ebp 
mov ebp,esp 


示例 2 ENTER 指令 为 局 部 变量 保留 了 8 个 字 节 的 堆栈 空间 : 


MySub PROC 
enter 8,0 


它 与 如 下 指令 等 效 : 


MySub PROC 
push ebp 
mov ebp,esp 
sub esp,8 


图 8-3 为 执行 ENTER 指令 前 后 的 堆栈 示意 图 。 


执行 前 执行 ENTER 8,0 





图 8-3 执行 ENTER 前 后 的 堆栈 示意 图 


如 果 要 使 用 ENTER 指令 ， 那 么 本 书 强 烈 建议 在 同一 个 过 程 的 结尾 处 同时 使 用 
LEAVE 指令 。 否 则 ， 为 局 部 变量 保留 的 堆栈 空间 就 可 能 无 法 释放 。 这 将 会 导致 RET 指 


令 从 堆栈 中 弹出 错误 的 返回 地 址 。 





LEAVE 指令 LEAVE 指令 结束 一 个 过 程 的 堆栈 帧 。 它 反 转 了 之 前 的 ENTER 指令 操作 : 
恢复 了 过 程 被 调用 时 ESP 和 EBP 的 值 。 再 次 以 MySub 过 程 为 例 ， 现 在 可 以 编码 如 下 : 
MySub PROC 


enter 8,0 


leave 
ret 
MySub ENDP 


下 面 是 与 之 等 效 的 指令 序列 ， 其 功能 是 在 堆栈 中 保存 和 删除 8 个 字 节 的 局 部 变量 : 


MySub PROC 


push ebp 
mov ebp,esp 
sub esp,8 


mov esp,ebp 
pop ebp 
ret 

MySub ENDP 
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238 吉 8 草 


8.2.9 LOCAL 伪 指令 


不 难 想象 ，Microsoft 创建 LOCAL 伪 指 令 是 作为 ENTER 指令 的 高 级 替补 。LOCAL 声 
明 一 个 或 多 个 变量 名 ， 并 定义 其 大 小 属性 ，( 另 一 方面 ，ENTER 则 只 为 局 部 变量 保留 一 块 未 
命名 的 堆栈 空间 。) 如 果 要 使 用 LOCAL 伪 指令 ， 它 必须 紧 跟 在 PROC 伪 指令 的 后 面 。 其 语 
法 如 下 所 示 : 


LOCAL varlist 


varlist 是 变量 定义 列表 ， 用 逗号 分 隔 表 项 ， 可 选 为 跨越 多 行 。 每 个 变量 定义 采用 如 下 
格式 : 


label: type 


其 中 ， 标 号 可 以 为 任意 有 效 标识 符 ， 类 型 既 可 以 是 标准 类 型 (WORD、DWORD 等 )， 
也 可 以 是 用 户 定义 类 型 。( 结 构 和 其 他 用 户 定义 类 型 将 在 第 10 章 进 行 说 明 。) 
示例 MySub 过 程 包含 一 个 局 部 变量 varl ， 其 类 型 为 BYTE: 
MySub PROC 
LOCAL varl:BYTE 
BubbleSort 过 程 包含 一 个 双 字 局 部 变量 temp 和 一 个 类 型 为 BYTE 的 SwapFlag 变量 : 
BubbleSort PROC 
LOCAL temp:DWORD, SwapFlag:BYTE 


Merge 过 程 包含 一 个 类 型 为 PTR WORD 的 局 部 变量 pArray， 它 是 一 个 16 位 整数 的 


Merge PROC 
LOCAL pArray:PTR WORD 


局 部 变量 TempArray 是 一 个 数组 ， 包 含 10 个 双 字 。 请 注意 用 方 括号 显示 数组 大 小 : 


LOCAL TempRrray[10]:DWORD 


MASM 代码 生成 
使 用 LOCAL 伪 指 令 时 ， 查 看 MASM 生成 代码 是 有 好 处 的 。 下 面 的 过 程 Examplel 有 一 
个 双 字 局 部 变量 : 


Examplel PROC 
LOCAL temp:DWORD 


mov eax,temp 
ret 
Examplel ENDP 


MASM 为 Examplel 生成 如 下 代码 ， 展 示 了 ESP 怎样 减 去 4， 以 便 为 双 字 变量 预 留 
空间 : 


push ebp 

mov ebp,esp 

add esp,O0FFFFFFFCh ;ESP 加 -4 
mov eax, [ebp 一 4] 

leave 

ret 


Examplel 的 堆栈 帧 示意 图 如 下 所 示 : 
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8.2.10 ”Microsoft x64 调用 规范 


Microsoft 遵循 固定 模式 实现 64 位 编程 中 的 参数 传递 和 子 程序 调用 ,该 模式 被 称 为 
Microsoft x64 调用 规范 ( Microsoft x64 calling convention)。 它 既 用 于 C 和 C++ 编译 器 ， 也 
用 于 Windows API 库 。 只 有 在 要 么 调用 Windows 函数 ， 要 人 么 调用 C 和 C++ 函数 时 ， 才 需要 
使 用 这 个 调用 规范 。 它 的 特点 和 要 求 如 下 所 示 : 

1 ) 由 于 地 址 长 为 64 位， 因此 CALL 指令 把 RSP (堆栈 指针 ) 寄存 器 的 值 减 去 8。 

2 ) 第 一 批 传递 给 子 程序 的 四 个 参数 依次 存放 于 寄存 器 RCX、RDX、R8 和 R9。 因 此 ， 
如 果 只 传递 一 个 参数 ， 它 就 会 被 放 人 RCX。 如 果 还 有 第 二 个 参数 ， 它 就 会 被 放 人 RDX， 以 
此 类 推 。 其 他 参数 按照 从 左 到 右 的 顺序 人 栈 。 

3 ) 长 度 不 足 64 位 的 参数 不 进行 零 扩 展 ， 因 此 ， 其 高 位 的 值 是 不 确定 的 。 

4 ) 如 果 返 回 值 的 长 度 小 于 或 等 于 64 位 ， 那 么 它 必 须 放 在 RAX 寄存 器 中 。 

5 ) 主 调 者 要 负责 在 堆栈 中 分 配 至 少 32 字 节 的 影子 空间 ， 以 便 被 调用 的 子 程序 可 以 选择 
将 寄存 器 保存 在 这 个 区 域 中 。 

6 ) 调用 子 程序 时 ， 堆 栈 指针 ( RSP) 必须 对 齐 16 字 节 边界 。CALL 指令 将 8 字 节 的 返 
回 地 址 压 和 人 堆栈 ， 因 此 ， 主 调 程序 除了 把 堆栈 指针 减 去 32 以 便 存放 寄存 器 参数 之 外 ， 还 要 
减 去 8。 

7 ) 被 调用 子 程序 执行 结束 后 ， 主 调 程 序 需 负责 从 运行 时 堆栈 中 移 除 所 有 的 参数 和 影子 
空间 。 

8 ) 大 于 64 位 的 返回 值 存放 于 运行 时 堆栈 ， 由 RCX 指出 其 位 置 。 

9 ) 寄存 器 RAX、RCX、RDX、R8、R9、R10 和 R11l 常常 被 子 程序 修改 ， 因 此 ， 如 果 
主 调 程序 想 要 保存 它们 的 值 ， 就 应 在 调用 子 程序 之 前 将 它们 人 栈 ， 之 后 再 从 堆栈 弹出 。 

10 ) 寄存 器 RBX、RBP、RDI、RSI、R12、R13、R14 和 R15 的 值 必须 由 子 程序 保存 。 


8.2.11 本 节 回 顾 


1. ( 真 / 假 ): 子 程序 的 堆栈 帧 总 是 包含 主 调 程序 的 返回 地 址 和 子 程序 的 局 部 变量 。 
2. ( 真 / 假 ): 为 了 避免 被 复制 到 堆栈 ， 数 组 通过 引用 来 传递 。 

3. ( 真 / 假 ): 子 程序 开始 部 分 的 代码 总 是 将 EBP 人 栈 。 

4.( 真 / 假 ): 堆栈 指针 加 上 一 个 正 值 即 可 创建 局 部 变量 。 

5. ( 真 / 假 ): 32 位 模式 下 ， 子 程序 调用 中 最 后 人 栈 的 参数 保存 于 EBP+8 的 位 置 。 
6.( 真 / 假 ): 引用 传递 意味 着 将 参数 的 地 址 保存 在 运行 时 堆栈 中 。 

7. 堆栈 参数 有 哪 两 种 常见 类 型 ? 


8.3 递归 


递归 子 程序 (recursive subrountine) 是 指 直 接 或 间接 调用 自身 的 子 程序 。 递 归 ， 调 用 递 
归 子 程序 的 做 法 ， 在 处 理 具 有 重复 模式 的 数据 结构 时 ， 它 是 一 个 强大 的 工具 。 例 如 链表 和 各 
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种 类 型 的 连接 图 ， 这 些 情况 下 ,程序 都 需要 追踪 其 路 径 。 


无 限 递归 ” 子 程序 对 自身 的 调用 是 递归 中 最 显而易见 的 类 型 。 例 如 ， 下 面 的 程序 包含 一 


个 名 为 Endless 的 过 程 ， 它 不 间断 地 重复 调用 自身 : 


; 无 限 递 归 
INCLUDE Irvine32 .inc 
.data 
endlessStr BYTE "This recursion never stops",0 
.code 
main PROC 
call Endless 
exit 
main ENDP 


(Endless .asm) 


Endless PROC 
mov edx,OFFSET endlessSstr 
call WriteString 
call Endless 
ret ;? 从 不 执行 
Endless ENDP 
END main 


当然 ， 这 个 例子 没有 任何 实用 价值 。 每 次 过 程 调用 自身 时 ， 


它 会 占用 4 字 节 的 堆栈 空间 


让 CALL 指令 将 返回 地 址 人 栈 。RET 指令 永远 不 会 被 执行 ， 仅 当 堆栈 溢出 时 ， 程 序 终止 。 


8.3.1 递归 求 和 


实用 的 递归 子 程序 总 是 包含 终止 条 件 。 当 终止 条 件 为 真 时 ， 


随 着 程序 执行 所 有 挂 起 的 


RET 指令 ， 堆 栈 展开 。 举 例 说 明 ， 考 虑 一 个 名 为 CalcSum 的 递归 过 程 ， 执 行 整数 1 到 nn 的 
加 法 ， 其 中 是 通过 ECX 传递 的 输入 参数 。CalcSum 用 EAX 返回 和 数 : 


(RecursiveSum.asm) 


; 整数 求 和 

INCLUDE Irvine32 .inc 

.Code 

main PROC 
mov ecx,5 计数 值 =5 
mov eax,0 存放 和 数 
call calcSum ; 计算 和 数 

Ll: call WriteDec; 显示 EAX 
call Crlf 行 
exit 

main ENDP 

CalcSum PROC 

; 计算 整数 列表 的 和 数 

; 接收 : ECX= 计数 值 

; 返回 : EAX= 和 数 
cmp ecx,0 ; 检查 计数 值 
jz L2 ; 若 为 零 则 退出 
add ”eax,ecx ; 否则 ， 与 和 数 相 加 
dec ecx ; 计数 值 递减 
call CalcSum ; 递归 调用 

L2: ret 

CalcSsum ENDP 

end Main 


CalcSum 的 开始 两 行 检 查 计 数值 ， 若 ECX=0 则 退出 该 过 程 


， 代 码 就 跳 过 了 后 续 的 递归 
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调用 。 当 第 一 次 执行 RET 指令 时 ， 它 返回 到 前 一 次 对 CalcSum 的 调用 ， 而 这 个 调用 再 返回 
到 它 的 前 一 次 调用 ， 依 序 前 推 。 表 8-1 给 出 了 CALL 指令 压 人 堆栈 的 返回 地 址 (用 标号 表 
示 )， 以 及 与 之 相应 的 ECX (计数 值 ) 和 EAX (和 数 ) 的 值 。 


表 8-1 堆栈 帧 和 寄存 器 (CalcSum) 


TT ER 
| 





即使 是 一 个 简单 的 递归 过 程 也 会 使 用 大 量 的 堆栈 空间 。 每 次 过 程 调用 发 生 时 最 少 占用 4 
字 节 的 堆栈 空间 ， 因 为 要 把 返回 地 址 保存 到 堆栈 。 


8.3.2 计算 阶乘 


递归 子 程序 经 常用 堆栈 参数 来 保存 临时 数据 。 当 递归 调用 展开 时 ， 保 存在 堆栈 中 的 数据 
就 有 用 了 。 下 面 要 查看 的 例子 是 计算 整数 的 阶乘 。 阶 乘 算 法 计算 n! ， 其 中 半 是 无 符号 整 
数 。 第 一 次 调用 factorial 函数 时 ， 参 数 半 就 是 初始 数字 。 下 面 给 出 的 是 用 C/C++/Java 语法 
编写 的 代码 : 


int function factorial(int n) 


{ 


if(n == 0) 
return 1; 递归 调用 回 淹 





return % * factorial(n~—1}): 


} 


假设 给 定 任意 n， 即 可 计算 n-1 的 阶乘 。 这 样 就 可 以 不 断 
减少 x， 直到 它 等 于 0 为 止 。 根据 定义 ，0 ! =1。 而 回溯 到 原 
始 表 达 式 n! 的 过 程 ， 就 会 累积 每 次 的 乘积 。 比 如 计算 51 的 
递归 算法 如 图 8-4 所 示 ， 左 列 为 算法 递 进 过 程 ， 右 列 为 算法 回 
溯 过 程 。 

示例 程序 下 面 的 汇编 语言 程序 包含 了 过 程 Factorial， 递 
归 计 算 阶 乘 。 通 过 堆栈 把 由 (0 一 12 之 间 的 无 符号 整数 ) 传递 
给 过 程 Factorial， 返 回 值 在 EAX 中。 由 于 EAX 是 32 位 寄存 
器 ,因此 ， 它 能 容纳 的 最 大 阶乘 为 12 ! (479 001 600 )。 


; 计算 阶乘 (Fact.asm) 


INCLUDE Irvine32.inc 
.Code 
main PROC 
push 5 ;计算 51 
call Factorial ; 计算 阶乘 (EAX) 
call WriteDec ; 显示 结果 
Call Crlf 
exit 
main ENDP 





基本 情况 
图 8-4 ”阶乘 函数 的 递归 调用 


Factorial PROC 
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了 计算 阶乘 。 
7 接收 : [ebp+8]=n， 需 计算 的 数 
; 返回 : eax=n 的 阶乘 


push ebp 
mov ebp,esp 
mov eax,[ebp+8] ;获取 n 
cmp eax,0 ;n>07 
ja L1 ;是 : 继续 
mov eax,l ; 否 : 返回 01 的 值 1 
jmp 1L2 ; 并 返回 主 调 程 序 
Ll: dec eax 
push eax iFactorial (n-1) 
call Factorial 
7 每 次 递归 调用 返回 时 
; 都 要 执行 下 面 的 指令 
ReturnFact: 
mov ebx,[ebp+8] ;获取 n 
mul ebx ) EDX:EAX = EAX * EBX 
L2: pop ebp ;返回 EAX 
ret 4 ; 清除 堆栈 
Factorial ENDP 
END main 


现在 通过 跟踪 初始 值 N=3 的 调用 过 程 ， 来 更 加 详细 地 查看 Factorial。 按 照 其 说 明 中 的 
记录 ，Factorial 用 EAX 寄存 器 返回 结果 : 


push 3 
call Pactorial ; EAX = 31 


Factorial 过 程 接收 一 个 堆栈 参数 N 为 初始 值 ， 以 决定 计算 哪个 数 的 阶乘 。 主 调 程序 的 返 
回 地 址 由 CALL 指令 自动 人 栈 。Factorial 的 第 一 个 操作 是 把 EBP 入 栈 ， 以 便 保存 主 调 程序 
堆栈 的 基 址 指针 : 


Factorial PROC 
push ebp 


之 后 ， 它 必须 把 EBP 设置 为 当前 堆栈 帧 的 起 始 地 址 : 


mov ebp,esp 


现在 ，EBP 和 ESP 都 指向 栈 顶 ， 运 行 时 堆栈 的 堆栈 帧 如 下 图 所 示 。 其 中 包含 了 参数 N、 
主 调 程 序 的 返回 地 址 和 被 保存 的 EBP 值 : 


[EBP+8] 


<— ESP, EBP 





由 上 图 可 知 ， 要 从 堆栈 中 取出 并 加 载 到 EAX， 代 码 需 要 把 EBP 加 8 后 进行 基 址 - 偏 
移 量 寻 址 : 


mov eax,[ebp+8] ; 获取 n 


然后 ， 代 码 检查 基本 情况 (base case)， 即 停止 递归 的 条 件 。 如 果 N (EAX 当前 值 ) 等 于 


高 级 过 程 243 


0， 函 数 返回 1， 也 就 是 0! 的 定义 值 。 


cmp eax,0 :n>207 

ja L1 ; 是: 继续 

mov eax,l]  ; 否 ; 返回 01 的 结果 1 

jmp L2 ; 并 返回 主 调 程序 306 


( 稍 后 再 查看 标号 L2 的 代码 。) 由 于 当前 EAX 的 值 为 3，Factorial 将 递归 调用 自身 。 首 
先 ， 它 从 X 中 减 去 1， 并 把 新 值 人 栈 。 该 值 作为 参数 传递 给 新 调用 的 Factorial: 


L1: dec eax 
push eax ; Factorial(n - 1) 
call Factorial 


现在 ， 执 行 转向 Factorial 的 第 一 行 ， 计 算数 值 为 N 的 新 值 : 


Factorial PROC 
push ebp 
mov ebp,esp 


运行 时 堆栈 又 包含 了 第 二 个 堆栈 帧 ， 其 中 入 等 于 2: 


[EBP+8] 





<— ESP, EBP 


现在 N 的 值 为 2， 将 其 加 载 到 EAX， 并 与 0 比较 : 


mov ， eax, [ebp+8] ; 当前 N=2 


cmp eax,0 7N 与 0 比较 
ja 工 1 i 仍然 大 于 0 
mov eax,l ; 不 执行 
jmp L2 ; 不 执行 


NN 大 于 0， 因 此 ， 继 续 执行 标号 L1。 


提示 读者 可 能 已 经 注意 到 之 前 的 EAX， 即 第 一 次 调用 时 分 配给 Factorial 的 值 ， 
被 新 值 履 盖 了 。 这 说 明了 一 个 重要 的 事实 : 在 过 程 进行 递归 调用 时 ， 应 该 小 心 注意 哪些 


寄存 器 会 被 修改 。 如 果 需 要 保存 这 些 寄存 器 的 值 ， 就 需要 在 递归 调用 之 前 将 其 入 栈 ， 并 
在 调用 返回 之 后 将 其 弹出 堆栈 。 幸 运 的 是 ， 对 Factorial 过 程 而 言 ， 在 递归 调用 之 间 保 存 
EAX 并 不 是 必要 的 。 





执行 Ll 时， 将 会 用 递归 过 程 调用 来 计算 N-1 的 阶乘 。 代 码 将 EAX 减 1， 并 将 结果 人 
栈 ， 再 调用 Factorial: 


Lls dec eax 7 Ne 
push eax ; Factorialt(1) 
Call Factorial 


现在 ， 第 三 次 进入 Factorial， 堆 栈 中 也 有 了 三 个 活动 的 堆栈 帧 : 
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[EBP+8] 


<— ESP，EBP 





Factorial 过 程 将 NN 与 0 比较 ， 发 现 W 大 于 0， 则 再 次 调用 Factorial， 此 时 N=0。 当 最 后 


一 次 进入 Factorial 过 程 时 ， 和 运行 时 堆栈 出 现 了 第 四 个 堆栈 帧 : 


© 


[EBP+8] 


<— ESP, EBP 





在 N=0 时 调用 Factorial， 情况 变 得 有 趣 了 。 下 面 的 语句 产生 了 到 标号 L2 的 分 支 。 由 于 


! =1， 因 此 数值 1 赋 给 EAX， 而 EAX 必须 包含 Factorial 的 返回 值 : 


mov eax, [ebp+8] ;EAX = 0 

cmp eax,0 ;n>07 

ja L1 ; 是 : 继续 

mov eax,l ; 否 ; 返回 01 的 结果 1 
jmp L2 ; 并 返回 主 调 程序 


标号 L2 的 语句 如 下 ， 它 使 得 Factorial 返回 到 前 一 次 的 调用 : 


L2: pop ebp ;返回 EAX 
ret 4 ; 清除 堆栈 


此 时 、 如 下 图 所 示 ， 最 近 的 帧 已 经 不 在 运行 时 堆栈 中 ， 且 EAX 的 值 为 1 〈 零 的 阶乘 ): 
下 面 的 代码 行 是 Factorial 调用 的 返回 点 。 它 们 获取 X 的 当前 值 ( 保 存 于 堆栈 EBP+8 的 


位 置 )， 将 其 与 EAX (Factorial 调用 的 返回 值 ) 相 乘 。 那 么 ，EAX 中 的 乘积 就 是 Factorial 本 
次 和 迭代 的 返回 值 : 
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[EBP+8] 
| <— EsP, EBP 
(EAX=1 ) 

ReturnFact: 

mov ebx,[ebp+8] ;7 获取 n 

mul ebx 7 EAX = EAX * EBX 
L2: pop ebp ; 返回 EAX 

ret 4 ; 清除 堆栈 


Factorial ENDP 


( EDX 中 的 乘积 高 位 部 分 为 全 0， 可 以 忽略 。) 由 此 ， 上 述 代 码 行 第 一 次 得 以 执行 ，EAX 
保存 了 表达 式 1 x 1 的 乘积 。 随 着 RET 指令 的 执行 ， 又 一 个 堆栈 帧 从 堆栈 中 删除 : 





[EBP+8] 
<— ESP, EBP 
(EAX=1 ) 

再 次 执行 CALL 指令 后 面 的 语句 ,将 N( 现 在 等 于 2 ) 与 EAX 的 值 (等 于 1) 相 乘 : 
ReturnFact: 

mov ebx,[ebp+8] ;获取 nn 

mul ebx ; EDX:EAX = EAX * EBX 
L2: pop ebp 7 返回 EAX 

ret 4 ; 清除 堆栈 


Factorial ENDP 


EAX 中 的 乘积 现在 等 于 2，RET 指令 又 从 堆栈 中 移 除 一 个 堆栈 帧 : 





[EBP+8] 
<— ESP, EBP 
(EAX=2 ) 

现在 ， 最 后 一 次 执行 CALL 指令 后 面 的 语句 ,将 N( 等 于 3 ) 与 EAX 的 值 (等 于 2) 相 乘 : 
ReturnFact: 

mov ebx,[ebp+8] ; 获取 mn 

mul ebx ; EDX:EAX = EAX * EBX 
L2: pop ebp ; 返回 EAX 

ret 4 ; 清除 堆栈 


Factorial ENDP 
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EAX 的 返回 值 为 6， 是 31 的 计算 结果 ， 也 是 第 一 次 调用 Factorial 时 希望 进行 的 计算 。 


当 RET 指令 执行 时 ， 最 后 一 个 堆栈 帧 也 从 堆栈 中 移 除 。 


8.3.3 ”本 节 回 顾 


1. ( 真 / 假 ): 假设 完成 同样 的 任务 ， 递 归 子 程序 使 用 的 内 存 空间 通常 少 于 非 递归 子 程序 。 
2. Factorial 函数 中 ， 终 止 递归 的 条 件 是 什么 ? 

3. 汇编 语言 编写 的 Factorial 过 程 中 ， 每 次 递归 调用 结束 后 ， 要 执行 什么 指令 ? 

4. 如 果 计 算 131， 那 么 Factorial 程序 的 输出 会 出 现 什么 情况 ? 

5. 挑战 : 若 计算 51， 则 Factorial 过 程 需要 占用 多 少 字 节 的 堆栈 空间 ? 


8.4 INVOKE、ADDR、PROC 和 PROTO 


在 32 位 模式 中 ，INVOKE、PROC 和 PROTO 伪 指令 是 过 程 定义 和 调用 的 强大 工具 。 
ADDR 运算 符 与 这 些 伪 指令 一 起 使 用 ， 是 定义 过 程 参数 的 重要 工具 。 在 很 多 方面 ， 这 些 伪 指 
令 都 接近 于 高 级 编程 语言 提供 的 便利 。 但 是 ， 从 教学 的 角度 来 看 ， 它 们 的 使 用 是 有 争议 的 ， 
因为 它们 屏蔽 了 运行 时 堆栈 的 底层 结构 。 因 此 ， 在 使 用 这 些 伪 指令 之 前 ， 详 细 了 解 子 程序 调 
用 的 底层 机 制 是 非常 明智 的 。 

在 某 种 情况 下 ， 使 用 高 级 过 程 伪 指 令 会 得 到 更 好 的 编程 效果 一 一 即 程序 要 在 多 个 模块 之 
间 调 用 过 程 的 时 候 。 此 时 ，PROTO 伪 指令 对 照 过 程 声明 检查 参数 列表 ， 以 帮助 汇编 器 验证 
过 程 调用 。 这 个 特性 鼓励 经 验 丰 富 的 汇编 语言 程序 员 去 利用 高 级 MASM 伪 指令 提供 的 便利 。 


8.4.1 INVOKE 伪 指 令 


INVOKE 伪 指 令 ， 只 用 于 32 位 模式 ， 将 参数 人 栈 (按照 MODEL 伪 指 令 的 语言 说 明 符 
所 指定 的 顺序 ) 并 调用 过 程 。INVOKE 是 CALL 指令 一 个 方便 的 替代 品 ， 因 为 ， 它 用 一 行 代 
码 就 能 传递 多 个 参数 。 常 见 语法 如 下 : 


INVOKE procedureName [, argumentList]} 


ArgumentList 是 可 选项 ， 它 用 逗号 分 隔 传 递 给 过 程 的 参数 。 例 如 ， 执 行 若干 PUSH 指令 
后 调用 DumpArray 过 程 ， 使 用 CALL 指令 的 形式 如 下 : 


push TYPE array 
push LENGTHOF array 
push OFFSET array 
call DumpArray 


使 用 等 效 的 INVOKE 则 将 代码 减少 为 一 行列 表 中 的 参数 逆序 排列 (假设 遵循 
STDCALL 规范 ): 


INVOKE DumpArray, OFFSET array, LENGTHOF array, TYPE array 


INVOKE 对 参数 数量 几乎 没有 限制 ， 每 个 参数 也 可 以 独立 成 行 。 下 面 的 INVOKE 语句 
包含 了 有 用 的 注释 : 
INVOKE DumpArray, ;显示 数组 


OFFSET array， ，; 指向 数组 
LENGTHOF array，; 数组 长 度 


TYPE array ? 数组 元 素 的 大 小 类 型 
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参数 类 型 如 表 8-2 所 示 。 


表 8-2 INVOKE 的 参数 类 型 


myLIst，array，myWord，myDword OFFSET name | OFFSET myList 
地 址 表达 式 | [myListt2]，[ebx+esi] | 





覆盖 EAX 和 EDX 如果 向 过 程 传递 的 参数 小 于 32 位 ， 那 么 在 将 参数 人 栈 之 前 ，INVOKE 
为 了 扩展 参数 常常 会 使 得 汇编 器 覆盖 EAX 和 EDX 的 内 容 。 有 两 种 方法 可 以 避免 这 种 情况 : 
其 一 ,传递 给 INVOKE 的 参数 总 是 32 位 的 ; 其 二 ， 在 过 程 调用 之 前 保存 EAX 和 EDX， 在 
过 程 调用 之 后 再 恢复 它们 的 值 。 


8.4.2 ADDR 运算 符 


ADDR 运算 符 同 样 可 用 于 32 位 模式 ， 在 使 用 INVOKE 调用 过 程 时 ， 它 可 以 传递 指针 参 
数 。 比 如 ， 下 面 的 INVOKE 语句 给 FillArray 过 程 传递 了 myArray 的 地 址 : 


INVOKE FillArray, ADDR myArray 


传递 给 ADDR 的 参数 必须 是 汇编 时 常数 。 下 面 的 例子 就 是 错误 的 : 


INVOKE mySub, ADDR [ebp+12] ; 错误 
ADDR 运算 符 只 能 与 INVOKE 一 起 使 用 ， 下 面 的 例子 也 是 错误 的 : 
mov esi, ADDR myArray ; 错误 


示例 下 例 中 的 INVOKE 伪 指 令 调 用 Swap， 并 向 其 传递 了 一 个 双 字 数组 前 两 个 元 素 的 
地 址 : 


-data 
Array DWORD 20 DUP(?) 
.Code 


INVOKE Swap, 


ADDR Array, 
ADDR [Array+4] 


假设 使 用 STDCALL 规范 ， 那 么 汇编 器 生成 的 相应 代码 如 下 所 示 : 


push OFFSET Array+4 
push OFFSET Array 
call Swap 


8.4.3 PROC 伪 指 令 


1.PROC 伪 指 令 的 语法 
32 位 模式 中 ，PROC 伪 指 令 基本 语法 如 下 所 示 : 


label PROC [attributes)] [USES regiist], parameter_ list 


Label 是 按照 第 3 章 说 明 的 标识 符 规则 、 由 用 户 定义 的 标号 。Attributes 是 指 下 述 任 一 
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内 容 : 
[Gistance] [langtype] [visibility] [prologuearg] 
表 8-3 对 这 些 属性 进行 了 说 明 。 
表 8-3 PROC 伪 指 令 的 属性 域 
属性 说 明 


distance NEAR 或 FAR。 指 定 汇编 器 生成 的 RET 指令 (RET 或 RETF) 类 型 

langtype 指定 调用 规范 (参数 传递 规范 )， 如 C、PASCAL 或 STDCALL。 能 覆盖 由 .MODEL 伪 指 令 指 定 的 
语言 

visibility 指明 本 过 程 对 其 他 模块 的 可 见 性 。 选 项 包括 PRIVATE 、PUBLIC (默认 项 ) 和 EXPORT。 若 可 见 性 为 
EXPORT， 则 链接 器 把 过 程 名 放 人 分 有 段 可 执行 文件 的 导出 表 。EXPORT 也 使 之 具有 了 PUBLIC 可 见 性 

prologuearg | ”指定 会 影响 开始 和 结尾 代码 生成 的 参数 


2. 参数 列表 


PROC 伪 指 令 允 许 在 声明 过 程 时 ， 添 加 上 用 逗号 分 隔 的 参数 名 列表 。 代 码 实 现 可 以 用 名 
称 来 引用 参数 ， 而 不 是 计算 堆栈 偏 移 量 ， 如 [ebp+8]: 


label PROC [attributes] [USES re9glist]， 
parameter_i, 
parameter_2, 


parameter_n 


如 果 参 数列 表 与 PROC 在 同一 行 ， 则 PROC 后 面 的 逗号 可 以 省 略 : 


label PROC [attributes], parameter_1, parameter_ 2, ..., parameter_n 


每 个 参数 的 语法 如 下 : 


paramName: type 


ParamName 是 分 配给 参数 的 任意 名 称 ， 其 范围 只 限于 当前 过 程 ( 称 为 局 部 作用 域 ( local 
scope))。 同 样 的 参数 名 可 以 用 于 多 个 过 程 ， 但 却 不 能 作为 全 局 变量 或 代码 标号 的 名 称 。 
Type 可 以 在 这 些 类 型 中 选择 : BYTE、SBYTE、WORD 、SWORD 、DWORD 、SDWORD、 
FWORD 、QWORD 或 TBYTE。 此 外 ，type 还 可 以 是 限定 类 型 (qualified type)， 如 指向 现 
有 类 型 的 指针 。 下 面 是 限定 类 型 的 例子 : 

PTR BYTE PTR SBYTE 

PTR WORD PTR SWORD 

PTR DWORD PTR SDWORD 

PTR QWORD PTR TBYTE 

虽然 可 以 在 这 些 表达 式 中 添加 NEAR 和 FAR 属性， 但 它们 只 与 更 加 专用 的 应 用 程序 相 
限定 类 型 还 能 够 用 TYPEDEF 和 STRUCT 伪 指 令 创 建 ， 具 体内 容 参 见 第 10 章 。 

示例 1 AddTwo 过 程 接收 两 个 双 字 数值 ， 用 EAX 返回 它们 的 和 数 : 


AddTwo PROC， 
vall:DWwORD, 
val2 :DWORD 
mov eax,vall 


兴 
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add eax,val2 
ret 
AddTwo ENDP 


AddTwo 汇编 时 ，MASM 生成 的 汇编 代码 显示 了 参数 名 是 如 何 被 转换 为 EBP 偏 移 量 的 。 
由 于 使 用 的 是 STDCALL， 因 此 RET 指令 附加 了 一 个 常量 操作 数 : 


AddTwo PROC 
push ebp 
mov ebp, esp 
mov eax,dword ptr [ebp+8] 
add eax,dword ptr [ebp+0Ch] 
leave 
ret 8 

AddTwo ENDP 


注意 : 用 指令 ENTER 0，0 来 代替 下 面 的 语句 ，AddTwo 过 程 也 一 样 正确 : 
push ebp 
mov ebp,esp 





示例 2 FillArray 过 程 接收 一 个 字 节 数组 的 指针 : 


FillArray PROC， 
pArray:PTR BYTE 


FillArray ENDP 


示例 3 Swap 过 程 接收 两 个 双 字 指针 : 


Swap PROC, 
pValX:PTR DWORD, 
pValY:PTR DWORD 


Swap ENDP 


示例 4 Read_File 过 程 接收 一 个 字 节 指针 pBuffer， 有 一 个 局 部 双 字 变量 fileHandle， 
并 把 两 个 寄存 器 保存 人 栈 (EAX 和 EBX): 


Read File PROC USES eax ebx 
pBuffer:PTR BYTE 
LOCAL fileHandle:DWORD 


mov esi,pBuffer 
mov fileHandle,eax 


ret 
Read File ENDP 


MASM 为 Read_File 生成 的 代码 显示 了 在 EAX 和 EBX 人 栈 (由 USES 子 句 指定 ) 前 ， 
如 何 为 局 部 变量 (fileHandle) 预 留 堆栈 空间 : 


Read File PROC 
push ebp 
mov ebp,esp 


add esp,OFFFFFFFCh ; 创建 fileHandle 
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Push eax ;? 保存 EAX 
push ebx ; 保存 EBX 
mov esi,dword ptr [ebp+8] ; pBuffer 
mov dword ptr [ebp 一 4],eax ; fileHandle 
pop ebx 
PoP eax 
leave 
ret 4 


Read_File ENDP 


注意 : 尽管 Microsoft 没有 采用 这 种 方法 ,但 Read_File 生成 代码 的 开始 部 分 还 可 以 是 
这 样 的 : 


Read File PROC 
enter 4,0 
push eax 
(etc.) 


ENTER 指令 首先 保存 EBP， 再 将 它 设置 为 堆栈 指针 的 值 ， 并 为 局 部 变量 保留 空间 。 
由 PROC 修改 的 RET 指令 ” 当 PROC 有 一 个 或 多 个 参数 时 ，STDCALL 是 默认 调用 规 
范 。 假 设 PROC 有 nn 个 参数 ，MASM 将 生成 如 下 人 口 和 出 口 代码 : 


push ebp 
mov ebp,esp 


i 

RET 指令 中 的 常数 是 参数 个 数 乘 以 4 (因为 每 个 参数 都 是 一 个 双 字 )。 若 使 用 了 
INCLUDE Irvine32.inc， 则 STDCALL 是 默认 规范 ， 它 是 所 有 Windows API 函数 调用 使 用 的 
调用 规范 。 

3. 指定 参数 传递 协议 

一 个 程序 可 以 调用 Irvine32 链接 库 过 程 ， 反 之 ， 也 可 以 包含 能 被 C++ 程序 调用 的 过 程 。 
为 了 提供 这 样 的 灵活 性 ，PROC 伪 指 令 的 属性 域 允许 程序 指定 传递 参数 的 语言 规范 ， 并 且 能 
覆盖 .MODEL 伪 指 令 指定 的 默认 语言 规范 。 下 例 声 明 的 过 程 采用 了 C 调用 规范 : 


Examplel PROC C, 
parml :DWORD, parm2:DWORD 


车 用 INVOKE 执行 Example1， 汇 编 器 将 生成 符合 C 调用 规范 的 代码 。 同 样 ， 如 果 用 
STDCALL 声明 Examplel1，INVOKE 的 生成 代码 也 会 符合 这 个 语言 规范 : 


Examplel PROC STDCALL, 
parml ;DWORD, parm2 :DWORD 


8.4.4 PROTO 伪 指 令 
64 模式 中 ，PROTO 伪 指 令 指定 程序 的 外 部 过 程 ， 示 例如 下 : 


ExitProcess PROTO 
.Code 

mov ecx,0 

call ExitProcess 


然而 在 32 位 模式 中 ，PROTO 是 一 个 更 有 用 的 工具 ， 因 为 它 可 以 包含 过 程 参数 列表 。 可 
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以 说 ，PROTO 伪 指 令 为 现 有 过 程 创 建 了 原型 ( prototype)。 原 型 声明 了 过 程 的 名 称 和 参数 列 
表 。 它 还 允许 在 定义 过 程 之 前 对 其 进行 调用 ， 并 验证 参数 的 数量 和 类 型 是 否 与 过 程 的 定义 相 
匹配 。 


MASM 要 求 INVOKE 调用 的 每 个 过 程 都 有 原型 。PROTO 必须 在 INVOKE 之 前 首先 出 
现 。 换 句 话 说， 这 些 伪 指令 的 标准 顺序 为 : 
MySub PROTO ; 过 程 原型 


INVOKE MySub ; 过 程 调用 


MySub PROC ”，; 过 程 实现 


MySub ENDP 


还 有 一 种 情况 也 是 可 能 的 : 过 程 实现 可 以 出 现在 程序 的 前 面 ， 先 于 调用 该 过 程 的 
INVOKE 语句 。 在 这 种 情况 下 ，PROC 就 是 它 自己 的 原型 : 
MySub PROC ;? 过 程 定义 


MySub ENDP 
INVOKE MySub ; 过 程 调用 


假设 已 经 编写 了 一 个 特定 的 过 程 ， 创 建 其 原型 也 是 很 容易 的 ， 即 复制 PROC 语句 并 做 如 
下 修改 : 

e 将 关键 字 PROC 改 为 PROTO。 

e 如 有 USES 运算 符 ， 则 把 该 运算 符 连 同 其 寄存 器 列表 一 起 删除 。 

比如 ， 假 设 已 经 创建 了 ArraySum 过 程 : 


ArraySum PROC USES esi ecx, 


ptrArray:PTR DWORD， ，; 指向 数组 
szArray :DWORD 7 数组 大 小 
省 咯 其 余 代码 行 …… 
ArraySum ENDP 
下 面 是 与 之 对 应 的 PROTO 声明 : 


ArraySum PROTO, 
ptrArray:PTR DWORD，; 指向 数组 
szArray :DWORD ; 数组 大 小 


PROTO 伪 指 令 可 以 覆盖 .MODEL 伪 指 令 中 的 参数 传递 协议 。 但 它 必须 与 过 程 的 PROC 
声明 一 致 : 


Examplel PROTO C, 
parml :DWORD, parm2 :DWORD 


1. 汇编 时 参数 检查 

PROTO 伪 指 令 帮 助 汇编 器 比较 过 程 调用 和 过 程 定义 的 参数 列表 。 但 是 这 个 错误 检查 没 
有 如 C 和 C++ 语言 中 那样 重要 。 相 反 ，MASM 检查 参数 正确 的 数量 ， 并 在 某 些 情况 下 ， 匹 
配 实际 参数 和 形式 参数 的 类 型 。 比 如 ,假设 Subl 的 原型 声明 如 下 : 


316 
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Subl PROTO, pl:BYTE, p2:WORD, p3:PTR BYTE 


现在 定义 变量 : 


data 

byte 1 BYTE 10h 
word 1 WORD 2000h 
word 2 WORD 3000h 
dword _ 1 DWORD 12345678h 


那么 ， 下 面 是 Subl 的 一 个 有 效 调用 : 


INVOKE Subl, byte 1, word 1, ADDR byte 1 


MASM 为 这 个 INVOKE 生成 的 代码 显示 了 参数 按 道 序 压 人 堆栈 : 


push 404000h ; 指向 byte_1 的 指针 
sub esp,2 ; 在 栈 项 填充 两 个 字 节 
push word ptr ds:[00404001h] ;word_1 的 值 


mov al,byte ptr ds:[00404000h] ;byte 1 的 值 
push eax 
call 00401071 


EAX 被 覆盖 ，sub esp，2 指令 填充 接 下 来 的 两 个 堆栈 单元 ， 以 扩展 到 32 位 。 
MASM 会 检测 的 错误 ”如 果实 际 参 数 超过 了 形式 参数 声明 的 大 小 ，MASM 就 会 产生 一 
个 错误 : 


INVOKE Subl, word_1, word 2，ADDR byte 1 ;参数 1 错误 


如 果 调 用 Subl 时 参数 个 数 太 少 或 太 多 ， 则 MASM 会 产生 错误 : 
INVOKE Subl, byte 1, word 2 ; 错误 : 参数 个 数 太 少 


INVOKE Subl, byte_1, ; 错误 : 参数 个 数 太 多 
word 2, ADDR byte 1, word 2 


MASM 不 会 检测 的 错误 ”如 果实 际 参 数 的 类 型 小 于 形式 参数 的 声明 ， 那 么 MASM 不 会 
检测 出 错误 : 
INVOKE Subl, byte 1, byte_l1, ADDR byte 1 


相反 ，MASM 会 把 实际 参数 扩展 为 形式 参数 声明 的 类 型 大 小 。 下 面 是 INVOKE 示例 生 
成 的 代码 ， 其 中 第 二 个 实际 参数 (byte_1 ) 入 栈 之 前 ， 在 EAX 中 进行 了 扩展 : 


push 404000h ;byte_1 的 地 址 
mov alvbyte ptr ds:[00404000h] ;byte 1 的 值 
movzx eax,al ; 在 EAX 中 扩展 


push eax ; 入 栈 

mov al,byte ptr ds:[00404000h] ;byte 1 的 值 

push eax ; 入校“ 

call 00401071 ; 调用 Subl 

如 果 在 想 要 传递 指针 时 传递 了 一 个 双 字 ， 则 不 会 检测 出 任何 错误 。 当 子 程序 试图 把 这 个 
堆栈 参数 用 作 指 针 时 ， 这 种 情况 通常 会 导致 一 个 运行 时 错误 : 


INVOKE Sub1，byte_1，word_ 2，dword_1 ;无 错误 检 出 


2. ArraySum 示例 
现在 再 来 看 看 第 5 章 的 ArraySum 过 程 ， 它 对 一 个 双 字 数组 求 和 。 之 前 ， 过 程 用 寄存 器 
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传递 参数 ， 现 在 ， 可 以 用 PROC 伪 指 令 来 声明 堆栈 参数 : 


ArraySum PROC USES esi ecx, 


ptrArray:PTR DWORD, ;指向 数组 
szArray :DWORD ; 数组 大 小 
mov esi,ptrArray ;数组 地 址 
mov ecx,szArray ;数组 大 小 
mov eax,0 ;? 和 数 清 零 
cmp ecx,0 ;数组 长 度 =0 ? 
je 2 了 是 : 退出 
L1: add eax,[esil] ; 将 每 个 整数 加 到 和 数 中 
add esi,4 ; 指向 下 一 个 整数 
loop L1 ; 按 数组 大 小 重复 
L2: et ; 和 数 保存 在 EAX 中 


ArraySum ENDP 


INVOKE 语句 调用 ArraySum， 传 递 数组 地 址 和 元 素 个 数 : 


.data 
array DWORD 10000h,20000h,30000h,40000h,50000h 
theSum DWORD ? 


.Code 
main PROC 
INVOKE ArraySum, 
ADDR array， ; 数组 地 址 
LENGTHOF array ; 元 素 个 数 
mov theSum, eax ; 保存 和 数 
8.4.5 “参数 类 别 


过 程 参 数 一 般 按照 数据 在 主 调 程序 和 被 调用 过 程 之 间 传 递 的 方向 来 分 类 : 

e 输入 类 : 输入 参数 是 指 从 主 调 程序 传递 给 过 程 的 数据 。 被 调用 过 程 不 会 被 要 求 修改 
相应 的 参数 变量 ， 即 使 修改 了 ， 其 范围 也 只 能 局 限 在 自身 过 程 中 。 

e 输出 类 : 当主 调 程序 向 过 程 传递 变量 地 址 ， 就 会 产生 输出 参数 。 过 程 用 地 址 来 定位 
变量 ， 并 为 其 分 配 数据 。 比 如 ，Win32 控制 台 库 中 的 ReadConsole 函数 ， 其 功能 为 从 
键盘 读 和 人 一 个 字符 串 。 用 户 键入 的 字符 由 ReadConsole 保存 到 缓冲 区 中 ， 而 主 调 程 
序 传 递 的 就 是 这 个 字符 串 缓冲 区 的 指针 : 


.data 

buffer BYTE 80 DUP(?) 

inputHandle DWORD ? 

.code 

INVOKE ReadConsole, inputHandle, ADDR buffer, 
(etc.) 


。 输入 输出 类 : 输入 输出 参数 与 输出 参数 相同 ,只 有 一 个 例外 : 被 调用 过 程 预期 参数 
引用 的 变量 中 会 包含 一 些 数据 ， 并 且 能 通过 指针 来 修改 这 些 变量 。 


8.4.6 示例 : 交换 两 个 整数 


下 面 的 例子 实现 两 个 32 位 整数 的 交换 。Swap 过 程 有 两 个 输入 输出 参数 pValX 和 
pValY ， 它 们 是 交换 数据 的 地 址 : 

?Swap 过 程 示 例 (Swap.asm) 

INCLUDE Irvine32.inc 
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Swap PROTO, pValX:PTR DWORD, pValY:PTR DWORD 


data 
Array DWORD 10000h,20000h 


-Code 
main PROC 
; 显示 交换 前 的 数组 
mov esi,OFFSET Array 
mov ecx,2 ;? 计数 值 =2 
mov ebx,TYPE Array 
call DumpMem ; 显示 数组 
INVOKE Swap, ADDR Array, ADDR [Array+4] 
; 显示 交换 后 的 数组 
call DumpMem 
exit 
main ENDP 


Swap PROC USES eax esi edi, 


pValX:PTR DWORD, ; 第 一 个 整数 的 指针 
pValY:PTR DWORD ; 第 二 个 整数 的 指针 
; 交换 两 个 32 位 整数 的 值 
; 返回 : 无 
mov esi,pValx ; 获得 指针 
mov edi,pValy 
mov eax,[esil] ; 取 第 一 个 整数 
xchg eax, [edil] /与 第 二 个 数 交 换 
mov [esil],eax ; 替换 第 一 个 整数 
Se ;PROC 在 这 里 生成 RET 8 
Swap ENDP 
END main 


Swap 过 程 的 两 个 参数 pValX 和 pValY 都 是 输入 输出 参数 。 它 们 的 当前 值 要 输入 到 过 
程 ， 而 它们 的 新 值 也 会 从 过 程 输出 。 由 于 使 用 的 PROC 带 有 参数 ， 汇 编 器 把 Swap 过 程 末尾 
的 RET 指令 改 为 RET 8 (假设 调用 规范 是 STDCALL)。 


8.4.7 ”调试 提示 


本 节 提 醒 编程 者 要 注意 的 一 些 常 见 错误 是 汇编 语言 在 传递 过 程 参 数 时 会 遇 到 的 ， 希 望 编 
程 者 永远 不 要 犯 这 些 错误 。 

1. 参数 大 小 不 匹配 

数组 地 址 以 其 元 素 的 大 小 为 基础 。 比 如 ， 一 个 双 字 数组 第 二 个 元 素 的 地 址 就 是 其 起 始 地 
址 加 4。 假 设 调用 8.4.6 节 的 Swap 过 程 ， 并 传递 DoubleArray 前 两 个 元 素 的 指针 。 如 果 错 误 
地 把 第 二 个 元 素 的 地 址 计算 为 DoubleArray+1， 那 么 调用 Swap 后 ，DoubleArray 中 的 十 六 进 
制 结果 值 也 不 正确 : 


.data 

DoubleArray DWORD 10000h,20000h 

.Code 

INVOKE Swap, ADDR [DoubleArray + 0], ADDR [DoubleArray + 1] 


2. 传递 错误 类 型 的 指针 
在 使 用 INVOKE 时 ， 要 记 住 汇编 器 不 会 验证 传递 给 过 程 的 指针 类 型 。 例 如 ，8.4.6 节 的 
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Swap 过 程 期 望 接收 到 两 个 双 字 指 针 ， 假若 不 小 心 传递 的 是 指向 字 节 的 指针 : 


.data 

ByteArray BYTE 10h,20h,30h,40h,50h,60h,70h,80h 

:Code 

INVOKE Swap, ADDR [ByteArray + 0], ADDR [ByteArray + 1] 


程序 可 以 汇编 运行 ， 但 是 当 ESI 和 EDI 解 引用 时 ， 就 会 交换 两 个 32 位 数值 。 
3. 传递 立即 数 


如 果 过 程 有 一 个 引用 参数 ， 就 不 要 向 其 传递 立即 数 参数 。 考 虑 下 面 的 过 程 ， 它 只 有 一 个 
引用 参数 : 


Sub2 PROC, dataPtr:PTR WORD 


mov esi,dataptr ; 获得 地 址 
mov WORD PTR [esi],0 ; 解 引 用 ,分 配 零 
ret 

Sub2 ENDP 


汇编 下 面 的 INVOKE 语句 将 导致 一 个 运行 时 错误 。Sub2 过 程 接收 1000h 作为 指针 的 值 ， 
并 解 引用 到 内 存 地 址 1000h: 


INVOKE Sub2，1000h 


上 例 很 可 能 会 导致 一 般 性 保护 故障 ， 因 为 内 存 地 址 1000h 不 大 可 能 在 该 程序 的 数据 
段 中 。 


8.4.8 WriteStackFrame 过 程 


Irvine32 链接 库 有 个 很 有 用 的 过 程 WriteStackFrame， 用 于 显示 当前 过 程 堆栈 帧 的 内 容 ， 
其 中 包括 过 程 的 堆栈 参数 、 返 回 地 址 、 局 部 变量 和 被 保存 的 寄存 器 。 该 过 程 由 太平 洋 路 德 
大 学 (Pacific Lutheran University) 的 詹姆斯 布 林 克 ( James Brink) 教授 慷慨 提供 ， 原 型 
如 下 : 


WriteStackFrame PROTO, 
numParam: DWORD, ; 传递 参数 的 数量 
numLocalVal: DWORD, ; 双 字 局 部 变量 的 数量 
numSavedReg: DWORD ; 被 保存 寄存 器 的 数量 


下 面 的 代码 节选 自 WriteStackFrame 的 演示 程序 : 


main PROC 
mov eax, OEAEAEAEAh 
mov ebx, OEBEBEBEBh 
INVOKE myProc，1111h，2222h ; 传递 两 个 整数 参数 
exit 
main ENDP 


myProc PROC USES eax ebx, 
x: DWORD, y: DWORD 
LOCAL a:DWORD, b:DWORD 


PARAMS = 2 

LOCALS = 2 

SAVED REGS = 2 

mov ar0RARARARAh 

mov b,0BBBBh 

INVOKE WriteStackFrame, PARAMS, LOCALS, SAVED REGS 


1322 
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该 调用 生成 的 输出 如 下 所 示 : 


Stack Frame 


00002222 ebp+12 (parameter) 
00001111 ebp+8 (parameter) 
00401083 ebp+4 (return address) 


0012FFF0 ebp+0 (saved ebp) <--- ebp 
O000AAAA ebp-4 (local variable) 

0000BBBB ebp-8 (local variable) 

EAEAEAEA ebp-12 (saved register) 

EBEBEBEB ebp-16 (saved register) <--- esp 





还 有 一 个 过 程 名 为 WriteStackFrameName， 增 加 了 一 个 参数 ,保存 拥有 该 堆栈 帧 的 过 
程 名 : 


WriteStackFrameName PROTO, 


numParam: DWORD, ? 传递 参数 的 数量 

numLocalVal : DWORD, ;? 双 字 局 部 变量 的 数量 
numSsavedReg:DWORD， ; 被 保存 寄存 器 的 数量 
ProcName :PTR BYTE ;? 空 字 节 结 束 的 字符 串 


Irvine32 链接 库 的 源 代 码 保 存在 本 书 安装 目录 (通常 为 C : \Irvine) 的 \Examples\Lib32 
子 目 录 下 ， 文 件 名 为 Irvine32.asm。 


8.4.9 本 节 回 顾 


1. ( 真 / 假 ): CALL 指令 不 能 包含 过 程 参数 。 

2. ( 真 / 假 ): INVOKE 伪 指 令 最 多 能 包含 3 个 参数 。 

3. ( 真 / 假 ): INVOKE 伪 指 令 只 能 传递 内 存 操作 数 ， 不 能 传递 寄存 器 值 。 

4. ( 真 / 假 ): PROC 伪 指 令 可 以 包含 USES 运算 符 , 但 PROTO 伪 指 令 不 可 以 。 


8.5 新 建 多 模块 程序 


大 型 源 文件 难于 管理 且 汇 编 速 度 慢 ， 可 以 把 单个 文件 拆 分 为 多 个 子 文件 ， 但 是 ， 对 其 
中 任何 子 文件 的 修改 仍 需 对 所 有 的 文件 进行 整体 汇编 。 更 好 的 方法 是 把 一 个 程序 按 模块 
(module) (汇编 单位 ) 分 割 。 每 个 模块 可 以 单独 汇编 ， 因 此 ， 对 一 个 模块 源 代码 的 修改 就 只 
需要 重 汇编 这 个 模块 。 链 接 器 将 所 有 汇编 好 的 模块 ( OBJ 文件 ) 组 合 为 一 个 可 执行 文件 的 速 
度 是 相当 快 的 ， 链 接 大 量 目标 模块 比 汇编 同样 数量 的 源 代码 文件 花费 的 时 间 要 少 得 多 。 

新 建 多 模块 程序 有 两 种 常用 方法 : 其 一 是 传统 方法 ， 使 用 EXTERN 伪 指令 ， 基 本 上 它 
在 不 同 的 x86 汇编 器 之 间 都 可 以 进行 移植 。 其 二 是 使 用 Microsoft 的 高 级 伪 指 令 INVOKE 和 
PROTO， 这 能 够 简化 过 程 调用 ， 并 隐藏 一 些 底层 细节 。 本 节 将 对 这 两 种 方法 进行 说 明 ， 由 
编程 者 决定 使 用 哪 一 种 。 


8.5.1 隐藏 和 导出 过 程 名 


默认 情况 下 ，MASM 使 所 有 的 过 程 都 是 public 属性 ， 即 允许 它们 能 被 同一 程序 中 任何 
其 他 模块 调用 。 使 用 限定 词 PRIVATE 可 以 覆盖 这 个 属性 : 


mySub PROC PRIVATE 


使 过 程 为 private 属性 ， 可 以 利用 封装 原则 将 过 程 隐藏 在 模块 中 ， 如 果 其 他 模块 有 相同 
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过 程 名 ， 就 还 需 避 免 潜 在 的 重 名 冲突 。 

OPTION PROC : PRIVATE 伪 指 令 在 源 模块 中 隐藏 过 程 的 另 一 个 方法 是 ， 把 
OPTION PROC : PRIVATE 伪 指 令 放 在 文件 顶部 。 则 所 有 的 过 程 都 默认 为 private， 然 后 用 
PUBLIC 伪 指令 指明 那些 希望 其 可 见 的 过 程 : 

OPTION PROC:PRIVRATE 


PUBLIC mySub 323 


PUBLIC 伪 指 令 用 逗号 分 隔 过 程 名 : 


PUBLIC subl, sub2, sub3 


或 者 ， 也 可 以 单独 指定 过 程 为 public 属性 : 


mySub PROC PUBLIC 


mySub ENDP 


如 果 程 序 的 启动 模块 使 用 了 OPTION PROC : PRIVATE， 那 么 就 应 该 将 它 (通常 为 
main ) 指定 为 PUBLIC ， 和 否则 操作 系统 加 载 器 无 法 发 现 该 启动 模块 。 比 如 : 


main PROC PUBLIC 


8.5.2 调用 外 部 过 程 


调用 当前 模块 之 外 的 过 程 时 使 用 EXTERN 伪 指令 ， 它 确定 过 程 名 和 堆栈 帧 大 小 。 下 面 
的 示例 程序 调用 了 sub1 ， 它 在 一 个 外 部 模块 中 : 


INCLUDE Irvine32.inc 
EXTERN subl@0:PROC 
.code 
main PROC 
call subl@0 
exit 
main ENDP 
END main 


当 汇 编 器 在 源 文件 中 发 现 一 个 缺失 的 过 程 时 (由 CALL 指令 指定 )， 默 认 情 况 下 它 会 产 
生 错 误 消 息 。 但 是 ，EXTERN 伪 指 令 告诉 汇编 器 为 该 过 程 新 建 一 个 空地 址 。 在 链接 器 生成 
程序 的 可 执行 文件 时 再 来 确定 这 个 空地 址 。 

过 程 名 的 后 级 @n 确定 了 已 声明 参数 占用 的 堆栈 空间 总 量 (参见 8.4 节 扩 展 PROC 伪 指 
令 )。 如 果 使 用 的 是 基本 PROC 伪 指 令 ， 没 有 声明 参数 ， 那 么 EXTERN 中 的 每 个 过 程 名 后 组 
都 为 @0。 若 用 扩展 PROC 伪 指 令 声明 一 个 过 程 ， 则 每 个 参数 占用 4 字 节 。 假 设 现在 声明 的 
AddTwo 带 有 两 个 双 字 参 数 : 


AddTwo PROC, 
vall :DWORD, 
val2 :DWORD 


addmwo BNDE 
则 相应 的 EXTERN 伪 指 令 为 EXTERN AddTwo@8 : PROC。 或 者 ， 也 可 以 用 PROTO 
伪 指 令 来 代替 EXTERN: 334 
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AddTwo PROTO, 
vall :DWORD, 
val2 :DWORD 


8.5.3 ” 跨 模 块 使 用 变量 和 标号 


1. 导出 变量 和 符号 
默认 情况 下 ， 变 量 和 符号 对 其 包含 模块 是 私有 的 ( private)。 可 以 使 用 PUBLIC 伪 指 令 
输出 指定 过 程 名 ， 如 下 所 示 : 


PUBLIC count, SYM]1 
SYM1 = 10 

.data 

count DWORD 0 


2. 访问 外 部 变量 和 符号 
使 用 EXTERN 伪 指 令 可 以 访问 在 外 部 过 程 中 定义 的 变量 和 符号 : 


EXTERN name : type 


对 符号 (由 EQU 和 = 定义 ) 而 言 ，type 应 为 ABS。 对 变量 而 言 ，type 是 数据 定义 属性 ， 
如 BYTE、WORD、DWORD 和 SDWORD， 可 以 包含 PTR。 例 子 如 下 : 


EXTERN one:WORD, two:SDWORD, three:PTR BYTE, four:ABS 


3. 使 用 带 EXTERNDEF 的 INCLUDE 文件 

MASM 中 一 个 很 有 用 的 伪 指 令 EXTERNDEF 可 以 代替 PUBLIC 和 EXTERN。 它 可 以 放 
在 文本 文件 中 ， 并 用 INCLUDE 伪 指 令 复 制 到 每 个 程序 模块 。 比 如 ， 现 在 用 如 下 声明 定义 文 
件 vars.inc: 


; vars.inc 
EXTERNDEF count:DWORD, SYM]:ABS 


接着 ， 新 建 名 为 subl.asm 的 源 文件 ， 其 中 包含 了 count 和 SYM1， 以 及 一 条 用 于 把 
vars.inc 复制 到 编译 流 中 的 INCLUDE 语句 。 


; Subl .asm 

-386 

.model flat,STDCALL 
INCLUDE vars .inc 
SYM1 = 10 

.data 

count DWORD 0 

END 


因为 不 是 程序 启动 模块 ， 因 此 END 伪 指 令 省 略 了 程序 人 口 标号 ， 并 且 不 用 声明 运行 时 
堆栈 。 
现在 再 新 建 一 个 启动 模块 main.asm， 其 中 包含 vars.inc， 并 使 用 了 count 和 SYM1 


; main.asm 

.386 

.model flat,stdcall 

.Stack 4096 

ExitProcess proto, dwExitCode:dword 
INCLUDE vars.inc 

.Code 
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main PROC 
mov count,2000h 
mov eax,SYM1 
INVOKE ExitProcess,0 

main ENDP 

END main 


8.5.4 示例 : ArraySum 程序 


ArraySum 程序 ， 第 一 次 出 现在 第 5 章 ， 是 一 个 容易 划分 为 模块 的 程序 。 现 在 通过 其 结 
构图 (图 8-5 ) 来 快速 回顾 一 下 它 的 设计 。 带 阴影 的 矩形 表示 本 书 链接 库 中 的 过 程 。main 过 
程 调 用 PromptForIntegers，PromptForIntegers 再 调用 WriteString 和 ReadInt。 通 常 ， 为 多 
模块 程序 的 各 种 文件 创建 单独 的 磁盘 目录 最 容易 跟踪 这 些 文件 。 这 也 是 下 一 节 将 要 展示 的 
ArraySum 程序 的 做 法 。 









ArraySum 
程序 (main) 


图 8-5 _ ArraySum 程序 的 结构 图 


8.5.5 用 Extern 新 建 模块 


多 模块 ArraySum 程序 有 两 个 版 本 。 本 节 展 示 的 版 本 使 用 传统 的 EXTERN 伪 指令 引用 
位 于 不 同 模块 中 的 函数 。 稍 后 ，8.5.6 节 将 用 INVOKE 、PROTO 和 PROC 的 高 级 功能 来 实现 
同样 的 程序 。 

PromptForlntegers prompt.asm 是 PromptForIntegers 过 程 的 源 代 码 文件 。 它 显示 提 
示 要 求 用 户 输入 三 个 整数 ， 调 用 ReadInt 获取 数值 ， 并 将 它们 插入 数组 : 


; 提示 整数 输入 请 求 (_prompt .asm) 


INCLUDE Irvine32.inc 
-code 


PromptForIintegers PROC 


; 提示 用 户 为 数组 输入 整数 ， 并 用 

; 用 户 输入 填充 该 数组 。 

; 接收: 

; ptrPrompt:PTR BYTE  ; 提示 信息 字符 串 

; ptrArray:PTR DWORD  ; 数组 指针 
arraySize:DWORD ; 数组 大 小 

7 返回 : 无 


arraySize EQU [ebp+16] 

ptrArray EQU [ebp+12] 

ptrPrompt EQU [ebp+8] 
enter 0,0 


pushad ; 保存 全 部 寄存 器 
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mov ecx,arraySize 
cmp ecx,0 

jle 12 

mov edx,ptrPrompt 
mov esi,ptrArray 


Ll: call WriteString 
call ReadInt 
call CEtt 
mov [esil],eax 
add esi,4 
loop Ll 


L2: popad 

leave 

ret 12 
PromptForIintegers ENDP 
END 


ArraySum 
回 计 算 结果 : 


;ArraySum 过 程 


INCLUDE Irvine32.inc 
,code 


ArraySum PROC 


加 
; 计算 32 位 整数 数组 之 和 。 
和 接收 : 
ptrArray 
arraySize 
; 返回 : EAX= 和 数 
ptrArray EQU [ebp+8] 
arraySize EQU [ebp+12] 
enter 0,0 
push ecx 
push esi 


和 
让 
* 


mov eax,0 

mov esi,ptrArray 
mov ecx,arraySize 
cmp ecx,0 

jle 12 


Ll: add eax, [esi] 
add esi,4 


loop Ll 
L2: pop esi 
pop ecx 
leave 
ret 8 
ArraySum ENDP 


END 


DisplaySum _display.asm 模块 为 DisplaySum 过 程 ， 显 示 标 号 和 和 数 的 结果 : 


7DisplaySum 过 程 
INCLUDE Itrvine32 .inc 
“Code 


; 数据 大 小 入 0? 
; 是 : 退出 
; 提示 信息 的 地 址 


; 显示 字符 串 

;? 将 整数 读 入 EAX 
; 换行 

; 保存 入 数组 

7 下 一 个 整数 


7 恢复 全 部 寄存 器 
; 恢复 堆栈 


(_arrysum.asm) 


; 数组 指针 
; 数组 大 小 (DWROD) 


; 数组 大 小 过 0? 
;是 : 退出 

; 将 每 个 整数 加 到 和 数 中 
; 指向 下 一 个 整数 

; 按 数 组 大 小 重复 


; 用 EAX 返回 和 数 
; 恢复 堆栈 


(_display.asm) 


融 8 售 





_arraysum.asm 模块 为 ArraySum 过 程 ， 计 算数 组 元 素 之 和 ， 并 用 EAX 返 
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DisplaySum PROC 
;在 控制 台 显 示 和 数 ， 


; 接收 : 

; ptrPrompt ; 提示 字符 囊 的 偏 移 量 
5 上 theSum ; 数组 和 数 (DWROD) 
; 返回 : 无 

theSum EQU [ebp+12] 


ptrPrompt EQU [ebp+8] 
enter 0,0 
push eax 
push edx 


mov ”edx,ptrPrompt ; 提示 字符 串 的 指针 
call WriteString 

mov eax,theSum 

call WriteInt ; 显示 ERX 

Call CrlE 

pop edx 

pop eax 

leave 


ret 8 ; 恢复 堆栈 
DisplaySum ENDP 
END 


Startup 模块 ”Sum_main.asm 模块 为 启动 过 程 (main)。 其 中 的 EXTERN 伪 指 令 指定 了 
三 个 外 部 过 程 。 为 了 使 源 代码 更 加 友好 ， 用 EQU 伪 指 令 再 次 定义 了 过 程 名 : 


ArraySum EQU ArraySum@0 
PromptForIintegers EQU PromptForIntegerse0 
DisplaySum EQU DisplaySum@0 


每 次 过 程 调用 之 前 ， 用 注释 说 明了 参数 顺序 。 该 过 程 使 用 STDCALL 参数 传递 规范 : 


; 整数 求 和 过 程 (Sum_main.asm) 
; 多 模块 示例 

; 本 程序 由 用 户 输入 多 个 整数 ， 
;将 它们 存 入 数组 ， 计 算数 组 之 和 ， 
; 并 显示 和 数 。 

INCLUDE Irvine32.inc 


EXTERN PromptForIintegers@0:PROC 
EXTERN ArraySum@0:PROC, DisplaySum@0:PROC 


;为 方便 起 见 ， 重 新 定义 外 部 符号 


ArraySum EQU ArraySum@0 
PromptForIntegers EQU PromptForIintegers@0 
DisplaySum EQU DisplaySum@0 

; 修改 Count 来 改变 数组 大 小 : 

Count = 3 

.data 


promptl BYTE “Enter a signed integer: “,0 
prompt2 BYTE "The sum of the integers is: ",0 
array DWORD Count DUP(?) 


sum DWORD ? 
.Code 
main PROC 


ee 


; PromptForIintegers( addr promptl1, addr array, Count ) 


328 
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push Count 

push OFFSET array 

push OFFSET Prompt1 
call PromptForIintegers 


; Sum = ArraySum( addr array, Count ) 
push Count 
push OFFSET array 
call ArraySum 
mov sum,eax 


; DisplaySum( addr prompt2, sum ) 
push sum 
push OFFSET prompt2 
call DisplaySum 


call Crlf 
exit 
main ENDP 
END main 
本 程序 的 源 文件 保存 在 示例 程序 目录 下 的 ch08\IModSum32_traditional 文件 夹 中 。 
接 下 来 将 了 解 如 果 使 用 Microsoft 的 INVOKE 和 PROTO 伪 指 令 ， 上 述 程序 会 发 生 怎样 


的 变化 。 
8.5.6 用 INVOKE 和 PROTO 新 建 模 块 


32 位 模式 中 ， 可 以 用 Microsoft 的 INVOKE、PROTO 和 扩展 PROC 伪 指令 (8.4 节 ) 
新 建 多 模块 程序 。 与 更 加 传统 的 CALL 和 EXTERN 相 比 ， 它 们 的 主要 优势 在 于 : 能 够 将 
INVOKE 传递 的 参数 列表 与 PROC 声明 的 相应 列表 进行 匹配 。 

现在 用 INVOKE、PROTO 和 高 级 PROC 伪 指 令 重 新 编写 ArraySum。 为 每 个 外 部 过 程 创 
建 含 有 PROTO 人 擅 指 令 的 头 文件 是 很 好 的 开始 。 每 个 模块 都 会 包含 这 个 文件 (用 INCLUDE 
伪 指 令 ) 且 不 会 增加 任何 代码 量 或 运行 时 开销 。 如 果 一 个 模块 不 调用 特定 过 程 ， 汇 编 器 就 会 
忽略 相应 的 PROTO 伪 指 令 。 本 程序 源 代 码 位 于 \ch08\ModSum32_advanced foleder。 

sum.inc 头 文件 ”本 程序 的 sum.inc 头 文件 如 下 所 示 : 


; (sum.inc) 
INCLUDE Irvine32.inc 


PromptForIintegers PROTO, 
PtrPrompt:PTR BYTE，; 提示 字符 串 
PtrArray:PTR DWORD，; 数组 指针 
arraySize:DWORD ; 数组 大 小 


ArraySum PROTO, 
ptrArray:PTR DWORD，; 数组 指针 
arraySize:DWORD ; 数组 大 小 


DisplaySum PROTO, 
ptrPrompt:PTR BYTE，; 提示 字符 囊 
theSum: DWORD ;? 数组 之 和 


_prompt 模块 _prompt.asm 文件 用 PROC 伪 指 令 为 PromptForIntegers 过 程 声明 参数 ， 
用 INCLUDE 将 sum.inc 复制 到 本 文件 : 


; 提示 整数 输入 请 求 (_ prompt .asm) 
INCLUDE sum.inc ; 获得 过 程 原型 


Code 
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PromptForIintegers PROC, 


ptrPrompt :PTR BYTE, ; 提示 字符 囊 
ptrArray:PTR DWORD, ; 数组 指针 
arraySize:DWORD ;? 数组 大 小 


;提示 用 户 输入 数组 元 素 值 ， 并 用 用 户 输入 


; 填充 数组 。 

; 返回 ; 无 
pushad ; 保存 所 有 寄存 器 
mov ecx,arraySize 
cmp ecx,0 ; 数组 大 小 三 0? 
jle L2 ;7 是: 退出 
mov edx,ptrPrompt ; 提示 信息 的 地 址 
mov esi,ptrArray 

L1: call Writestring ; 显示 字符 串 
call ReadInt ; 把 整数 读 入 EAX 
QaIE CELS ; 换行 
mov [esi],eax ; 保存 入 数组 
add esi,4 ; 下 一 个 整数 
loop Ll1 

L2: popad ; 恢复 所 有 寄存 器 
ret 

PromptForIintegers ENDP 

END 


与 前 面 的 PromptForIntegers 版 本 比较 , 语句 enter 0, 0 和 1leave 不 见 了 ， 这 是 因为 当 
MASM 遇 到 PROC 伪 指令 及 其 声明 的 参数 时 ， 会 自动 生成 这 两 条 语句 。 同 样 ，RET 指令 也 
不 需要 自 带 常数 参数 了 (PROC 会 处 理 好 )。 

_arraysum 模块 ” 接 下 来 ，_arraysum.asm 文件 包含 了 ArraySum 过 程 : 


;RArraySum 过 程 (_arrysum.asm) 


INCLUDE sum.inc 
.code 


ArraySum PROC, 
ptrArray:PTR DWORD，，; 数组 指针 


arraySize:DWORD ; 数组 大 小 
; 计算 32 位 整数 数组 之 和 331 
DS TREE 
push ecx ;EAX 不 入 栈 

push esi 

mov eax,0 ; 和 数 清 零 


mov esi,ptrArray 
mov ecx,arraySize 


cmp ecx,0 ; 数组 大 小 三 0? 
jle. Ti2 ;是 : 退出 
Ll: add eax,[esi] ; 将 每 个 整数 加 到 和 数 中 
add esi,4 7 指向 下 一 个 整数 
loop L1 ; 按 数组 大 小 重复 
L2: pop esi 
pop ecx ; 用 EAX 返回 和 数 
ret 


ArraySum ENDP 
END 


264 萝 8 舍 


_display 模块 _display.asm 文件 包含 了 DisplaySum 过 程 : 
;DisplaySum 过 程 (_display.asm) 
INCLUDE Sum. inc 
.Code 
DisplaySum PROC, 

ptrPrompt:PTR BYTE， ; 提示 字符 串 

theSum:DWORD ; 数组 之 和 


7 在 控制 台 显 示 和 数 ， 
; 返回; 无 


mov edx,ptrPrompt  ; 提示 信息 的 指针 
call WriteString 
mov eax,theSum 
call WriteInt ; 显示 EAX 
Gall. Crlf 
pop edx 
pop eax 
ret 
DisplaySum ENDP 
END 


Sum_main 模块 ”Sum_main.asm (启动 模块 ) 包含 主 程序 并 调用 所 有 其 他 的 过 程 。 它 使 
用 INCLUDE 从 sum.inc 复制 过 程 原型 : 


; 整数 求 和 程序 (Sum_main.asm) 
INCLUDE sum.inc 


Count = 3 
.data 
PromPt1 BYTE "Enter a signed integer: ",0 


prompt2 BYTE "The sum of the integers is; ",0 
array DWORD Count DUP(?) 


sum DWORD  ? 
-Code 
main PROC 


call Clrscr 


INVOKE PromptForIintegers, ADDR promptl1, ADDR array, Count 
INVOKE ArraySum, ADDR array, Count 


mov sum,eax 
INVOKE DisplaySum, ADDR prompt2, sum 
carl CElt 
exit 

main ENDP 

END main 


小 结 本 节 与 上 一 节 展 示 了 在 32 位 模式 中 新 建 多 模块 程序 的 两 种 方法 一 一 第 一 种 使 用 
的 是 更 传统 的 EXTERN 伪 指令 ， 第 二 种 使 用 的 是 INVOKE 、PROTO 和 PROC 的 高 级 功能 。 
后 一 种 中 的 伪 指 令 简 化 了 很 多 细节 ， 并 为 Windows API 函数 调用 进行 了 优化 。 此 外 ， 它 们 
还 隐藏 了 一 些 细节 ， 因 此 ， 编 程 者 可 能 更 愿意 使 用 显 式 的 堆栈 参数 和 CALL 及 EXTERN 伪 
指令 。 
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8.5.7 ”本 节 回顾 


1.( 真 / 假 ): 链接 OBJ 模块 比 汇编 ASM 源 文 件 快 得 多 。 

2.( 真 / 假 ): 将 一 个 大 型 程序 分 割 为 多 个 短 模块 使 得 该 程序 更 难 维护 。 

3. ( 真 / 假 ): 多 模块 程序 中 ， 带 标号 的 END 语句 只 在 启动 模块 中 出 现 一 次 。 

4.( 真 / 假 ): PROTO 伪 指 令 会 占用 内 存 ， 因 此 ， 编 程 者 必须 注意 过 程 中 不 包含 PROTO 伪 指 
令 ， 除 非 该 过 程 确实 会 被 调用 。 


8.6 ”参数 的 高 级 用 法 ( 可 选 主题 ) 


本 节 将 讨论 32 位 模式 中 ， 向 运行 时 堆栈 传递 参数 时 一 些 不 常 遇 见 的 情况 。 比 如 ， 在 查 
看 由 C 和 C++ 编译 器 创建 的 代码 时 ， 就 有 可 能 发 现 其 中 用 到 了 将 在 下 面 说 明 的 技术 。 


8.6.1 受 USES 运算 符 影响 的 堆栈 


第 5 章 的 USES 运算 符 列 出 了 在 过 程 开始 保存 、 结 尾 恢复 的 寄存 器 名 。 汇 编 器 自动 为 每 
个 列 出 的 寄存 器 生成 相应 的 PUSH 和 POP 指令 。 但 是 必须 注意 的 是 : 如 果 过 程 用 常数 偏 移 
量 访问 其 堆栈 参数 ， 比 如 [ebp+8]， 那 么 声明 该 过 程 时 不 能 使 用 USES 运算 符 。 现 在 举例 说 
明 其 原因 。 下 面 的 MySubl 过 程 用 USES 运算 符 保 存 和 恢复 ECX 和 EDX: 


MYSubl PROC USES ecx edx 
ret 
MySubl ENDP 


当 MASM 汇编 MySubl 时 ， 生 成 代码 如 下 : 


push ecx 
push edx 
pop edx 
pop ecx 
ret 


假设 在 使 用 USES 的 同时 还 使 用 了 堆栈 参数 ， 如 MySub2 过 程 所 示 ， 该 参数 预期 保存 的 
堆栈 地 址 为 EBP+8: 


MySub2 PROC USES ecx edx 


push ebp ; 保存 基 址 指针 
mov ebp,esp ; 堆栈 帧 基 址 
mov eax,[ebp+8] ; 取 堆 栈 参 数 
pop ebp ; 恢复 基 址 指针 
ret 4 ; 清除 堆栈 


MySub2 ENDP 


则 MASM 为 MySub2 生成 的 相应 代码 如 下 : 


push ecx 

push edx 

push ebp 

mov ebp,esp 

mov eax,dword ptr [ebp+8] ; 错误 地 址 ! 
Pop ebp 

pop edx 

pop ecx 

ret 4 


由 于 汇编 器 在 过 程 开 头 插 入 了 ECX 和 EDX 的 PUSH 指令 ， 使 得 堆栈 参数 的 偏 移 量 发 
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生变 化 ， 从 而 导致 结果 错误 。 图 8-6 说 明了 为 什么 堆栈 参数 现在 必须 以 [EBP+16] 来 引用 。 
USES 在 保存 EBP 之 前 修改 了 堆栈 ， 破 坏 了 子 程序 常用 的 标准 开始 代码 。 





8.6.2 ”向 堆栈 传递 8 位 和 16 位 参数 


32 位 模式 中 ， 向 过 程 传递 堆栈 参数 时 ， 最 好 是 压 人 32 位 操作 数 。 虽 然 也 可 以 将 16 位 
操作 数 入 栈 ， 但 是 这 样 会 使 得 EBP 不 能 对 齐 双 字 边 界 ， 从 而 可 能 导致 出 现 页 面 失效 、 降 低 
运行 时 性 能 。 因 此 ， 在 人 栈 之 前 ， 要 把 操作 数 扩展 为 32 位 。 下 面 的 Uppercase 过 程 接收 一 
个 字符 参数 ， 并 用 AL 返回 其 大 写字 母 : 


Uppercase PROC 
push ebp 
mov ebp,esp 
mov al,[esp+8] ;AL= 字符 
cmp al,'a’ > 小 于 "a'? 


jb Ll ; 是 : 什么 都 不 做 

cmp al,'z' ;大 于 'z'? 

ja Ll ; 是 : 什么 都 不 做 

sub al,32 ; 否 : 转换 字符 
Ll: 

pop ebp 

ret 4 ; 清除 堆栈 


Uppercase ENDP 


当 向 Uppercase 传递 一 个 字母 字符 时 ，PUSH 指令 自动 将 其 扩展 为 32 位 : 
ey te 
如 果 传 递 的 是 字符 变量 就 需要 更 小 心 一 些 ， 因 为 PUSH 指令 不 允许 操作 数 为 8 位: 


.data 

charVal BYTE ‘x' 

.Code 

push charVal  ”; 语法 错误 ! 
Call Uppercase 


相反 ， 要 用 MOVZX 把 字符 扩展 到 EAX: 


movzx eax,charVal  ; 扩展 并 传送 
push eax 
call Uppercase 


16 位 参数 示例 
假设 现在 想 向 之 前 给 出 的 AddTwo 过 程 传递 两 个 16 位 整数 。 由 于 该 过 程 期 望 的 数值 为 
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32 位 ， 所 以 下 面 的 调用 会 发 生 错误 : 


.data 

wordl WORD 1234h 

word2 WORD 4111h 

‘Code 

push wordl 

push word2 

call AddTwo ; 错误 ! 


因此 ， 可 以 在 每 个 参数 入 栈 之 前 进行 全 零 扩 展 。 下 面 的 代码 将 会 正确 调用 AddTwo: 


movzx eax,wordl 

push eax 

movzx eax,word2 

push eax 

call AddTwo  ; EAX 为 和 数 





8.6.3 传递 64 位 参数 


32 位 模式 中 ， 通 过 堆栈 向 子 程序 传递 64 位 参数 时 ， 先 将 参数 的 高 位 双 字 人 栈 ， 再 将 其 
低位 双 字 人 栈 。 这 样 就 使 得 整数 在 堆栈 中 是 按照 小 端 顺序 〈 低 字 节 在 低地 址 ) 存放 的 ， 因 而 
子 程序 容易 检索 到 这 些 数 值 ， 如 同 下 面 的 WriteHex64 过 程 操 作 一 样 。 该 过 程 用 十 六 进 制 显 
示 64 位 整数 : 


WriteHex64 PROC 
Push ebp 
mov ebp,esp 
mov ”eax,[ebp+12] ; 高 位 双 字 
call WriteHex 
mov eax,[ebp+8] ;低位 双 字 
call WriteHex 
pop ebp 
ret 8 
WriteHex64 ENDP 


WriteHex64 的 调用 示例 如 下 ， 它 先 把 longVal 的 高 半 部 分 人 栈 ， 再 把 longVal 的 低 半 部 
分 人 栈 : 

.data 

longVal QWORD 1234567800ABCDEFh 

.Code 

push DWORD PTR longVal + 4 ;高 位 双 字 

push DWORD PTR longVal 7 低位 双 字 

call WriteHex64 


图 8-7 显示 的 是 在 EBP 人 栈 ,， 并 把 ESP 复制 给 EBP 之 后 , WriteHex64 的 堆栈 帧 示意 图 。 


12345678 机 
00ABCDEF 


8-7 EBP 入 栈 后 的 堆栈 帧 





[EBP+12] 
[EBP+8] 
[EBP+4] 

<— EBP, ESP 
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8.6.4 ” 非 双 字 局 部 变量 


在 声明 不 同 大 小 的 局 部 变量 时 ，LOCAL 伪 指 令 的 操作 会 变 得 很 有 趣 。 每 个 变量 都 按照 
其 大 小 来 分 配 空间 : 8 位 的 变量 分 配给 下 一 个 可 用 的 字 节 ，16 位 的 变量 分 配给 下 一 个 偶 地 址 
( 字 对 齐 )，32 位 变量 分 配给 下 一 个 双 字 对 齐 的 地 址 。 现 在 来 看 几 个 例子 。 首 先 ，Example 过 
程 含 有 一 个 局 部 变量 varl ， 类 型 为 BYTE: 


Examplel PROC 
LOCAL varl:byte 
mov al,varl ; [EBP ~ 11] 
ret 

Examplel ENDP 


由 于 32 位 模式 中 ， 堆 栈 偏 移 量 默认 为 32 位 ， 因 此 ，varl 可 能 被 认为 会 存放 于 EBP-4 
的 位 置 。 实 际 上 ， 如 图 8-8 所 示 ，MASM 将 EBP 减 去 4， 但 是 却 把 varl 存放 在 EBP-1， 其 
下 面 的 三 个 字 节 并 未 使 用 (用 nu 标记 ， 表 示 没 有 使 用 )。 图 中 ， 每 个 方块 表示 一 个 字 节 。 

过 程 Example2 含 一 个 双 字 局 部 变量 和 一 个 字 节 局 部 变量 : 


Example2 PROC 
local temp:dword, SwapFlag:BYTE 


ret 
Example2 ENDP 


汇编 器 为 Example2 生成 的 代码 如 下 所 示 。ADD 指令 将 
ESP 加 一 8， 在 ESP 和 EBP 之 间 为 这 两 个 局 部 变量 预 留 了 空间 : ESP 一 > [mu 中 [EBp-4] 






push ebp 


图 FE 2 
mov ebp,esp 8-8 为 局 部 变量 保留 空间 
add esp,0FFFFFFF8h ; ESP+(-8) (Examplel 过 程 ) 
mov eax,[ebp-4] ; temp 
mov bl,[ebp-5] ; SwapFlag 


leave 
ret 


虽然 SwapFlag 只 是 一 个 字 节 变量 , 但 是 ESP 还 是 会 下 移 
到 堆栈 中 下 一 个 双 字 的 位 置 。 图 8-9 以 字 节 为 单位 详细 展示 了 
堆栈 的 情况 : SwapFlag 确切 的 位 置 以 及 位 于 其 下 方 的 三 个 没有 RE 
使 用 的 空间 (用 nu 标记 )。 图 中 ， 每 个 方块 表示 一 个 字 节 。 

如 果 要 创建 超过 几 百 字 节 的 数组 作为 局 部 变量 ， 那 么 一 定 
要 确保 为 运行 时 堆栈 预 留 足够 的 空间 。 此 时 可 以 使 用 STACK 伪 “| 
指令 。 比 如 ， 在 Irvine32 链接 库 中 ， 要 预 留 4096 个 字 节 的 堆栈 
空间 : Nl resP-a4 

SwapFlag 转 [EBP-5] 

.Stack 4096 [mu 

对 艇 套 调 用 来 说 ， 不 论 程序 执行 到 哪 一 步 ， 运 行 时 堆栈 都 
必须 大 到 能 够 容纳 下 全 部 的 活跃 局 部 变量 。 比 如 在 下 面 的 代码 
中 ，Subl 调用 Sub2，Sub2 调用 Sub3 ， 每 个 过 程 都 有 一 个 局 部 ”图 8-9 Example2 中 为 局 部 
数组 变量 : 变量 保留 空间 
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Subl PROC 


local arrayl[50]:dword ; 200 字 节 
callSub2 

ret 

Subl ENDP 

Sub2 PROC 

local array2[80]:word ; 160 字 节 
callSub3 

ret 

Sub2 ENDP 

Sub3 PROC 


local array3[300]:dword ; 1200 字 节 


ENDP 

当 程 序 进 入 Sub3 时 ， 运 行 时 堆栈 中 有 来 自 Subl 、Sub2 和 Sub3 的 全 部 局 部 变量 。 那 么 
堆栈 总 共 需 要 : 1560 个 字 节 保存 局 部 变量 ， 加 上 两 个 过 程 的 返回 地 址 (8 字 节 )， 还 要 加 上 
在 过 程 中 人 栈 的 所 有 寄存 器 占用 的 空间 。 若 过 程 为 递归 调用 ， 则 堆栈 空间 大 约 为 其 局 部 变量 
与 参数 总 的 大 小 乘 以 预计 的 递归 次 数 。 


8.7 Java 字 节 码 (可 选 主题 ) 


8.7.1 Java 虚拟 机 


Java 虚拟 机 ( JVM) 是 执行 已 编译 Java 字 节 码 的 软件 。 它 是 Java 平台 的 重要 组 成 部 分 ， 
包括 程序 、 规 范 、 库 和 数据 结构 ， 让 它们 协同 工作 。Java 字 节 码 是 指 编译 好 的 Java 程序 中 
使 用 的 机 器 语言 的 名 字 。 

虽然 本 书 的 内 容 为 x86 处 理 器 的 原生 汇编 语言 ， 但 是 了 解 其 他 机 器 架构 如 何 工作 也 是 有 
益 的 。JVM 是 基于 堆栈 机 器 的 首选 示例 。JVM 用 堆栈 实现 数据 传送 、 算 术 运 算 、 比 较 和 分 
支 操作 ， 而 不 是 用 寄存 器 来 保存 操作 数 (如同 x86 一 样 )。 

JVM 执行 的 编译 程序 包含 了 Java 字 节 码 。 每 个 Java 源 程序 都 必须 编译 为 Java 字 节 码 
(形式 为 ,class 文件 ) 后 才能 执行 。 包 含 Java 字 节 码 的 程序 可 以 在 任何 安装 了 Java 运行 时 软 
件 的 计算 机 系统 上 执行 。 

例如 ， 一 个 Java 源 文件 名 为 Account.java， 编 译 为 文件 Account.class。 这 个 类 文件 是 该 
类 中 每 个 方法 的 字 节 码 流 。JVM 可 能 选择 实时 编译 (just-in-time compilation ) 技术 把 类 字 节 
码 编译 为 计算 机 的 本 机 机 器 语言 。 

正在 执行 的 Java 方 法 有 自己 的 堆栈 帧 存放 局 部 变量 、 操 作 数 栈 、 输 入 参数 、 返 回 地 址 
和 返回 值 。 操 作 数 区 实际 位 于 堆栈 顶端 ， 因 此 ， 压 入 这 个 区 域 的 数值 可 以 作为 算术 和 逻辑 运 
算 的 操作 数 ， 以 及 传递 给 类 方法 的 参数 。 

在 局 部 变量 被 算术 运算 指令 或 比较 指令 使 用 之 前 ， 它 们 必须 被 压 入 堆栈 帧 的 操作 数 区 
域 。 从 现在 开始 ， 本 书 把 这 个 区 域 称 为 操作 数 栈 (operand stack ) 。 
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Java 字 节 码 中 ,每 条 指令 包含 1 字 节 的 操作 码 、 零 个 或 多 个 操作 数 。 操 作 码 可 以 用 
Java 反 汇 编 工 具 显示 名 字 ， 如 iload 、istore 、imul 和 goto。 每 个 堆栈 项 为 4 字 节 (32 位 )。 

查看 反 汇 编 字 节 码 

Java 开发 工具 包 (JDK) 中 的 工具 javap.exe 可 以 显示 java.class 文件 的 字 节 码 ， 这 个 操 
作 被 称 为 文件 的 反 汇 编 。 命 令 行 语法 如 下 所 示 : 


javap 一 c classname 


比如 ， 若 类 文件 名 为 Account.class， 则 相应 的 javap 命令 行为 


javap 一 c Account 
安装 Java 开发 工具 包 后 ， 可 以 在 \bin 文件 夹 下 找到 javap.exe 工具 。 


8.7.2 ”指令 集 


1. 基本 数据 类 型 

JVM 可 以 识别 7 种 基本 数据 类 型 ， 如 表 8-4 所 示 。 和 x86 整数 一 样 ， 所 有 有 符号 整数 
都 是 二 进 制 补 码 形式 。 但 它们 是 按照 大 端 顺序 存放 的 ， 即 高 位 字 节 位 于 每 个 整数 的 起 始 地 址 
(x86 的 整数 按 小 端 顺序 存放 )。IEEE 实数 格式 将 在 第 12 章 说 明 。 

表 8-4 Java 基本 数据 类 型 

Le | s | 
| 1 | 有 NS 到 数 | ma | 4 | 
| | 
| + | 有 NS4 数 | | | 

2. 比较 指令 

比较 指令 从 操作 数 栈 的 顶端 弹出 两 个 操作 数 ， 对 它们 进行 比较 ， 再 把 比较 结果 压 人 堆 
栈 。 现 在 假设 操作 数 人 栈 顺 序 如 下 所 示 : 


crabs 
| op! | 


下 表 给 出 了 比较 opl 和 op2 之 后 压 人 堆栈 的 数值 : 





数据 类 型 







有 符号 整数 
IEEE 单 精度 实数 
IEEE 双 精 度 实数 















op1 和 op2 比较 的 结果 压 入 操作 数 栈 的 数值 
op1>op2 1 
op1=op2 0 
opl<op2 = 
dcmp 指令 比较 双 字 ，fcmp 指令 比较 浮 点 数 。 
3. 分 支 指令 


分 支 指令 可 以 分 为 有 条 件 分 支 和 无 条 件 分 支 。Java 字 节 码 中 无 条 件 分 支 的 例子 是 goto 
和 jsr。 
goto 指令 无 条 件 分 支 到 一 个 标号 : 


goto label 
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jsr 指令 调用 用 标号 定义 的 子 程序 。 其 语法 如 下 : 


jsr label 


条 件 分 支 指令 通常 检测 从 操作 数 栈 项 弹出 的 数值 。 根 据 该 值 ， 指 令 决 定 是 否 分 支 到 给 定 
标号 。 比 如 ，ifle 指令 就 是 当 弹 出 数值 小 于 等 于 0 时 跳 转 到 标号 。 其 语法 如 下 : 


ifle labei 


同样 ，ifgt 指令 就 是 当 弹出 数值 大 于 等 于 0 时 跳 转 到 标号 。 其 语法 如 下 : 


ifgt label 


8.7.3 ”Java 反 汇 编 示 例 


为 了 帮助 理解 Java 字 节 码 是 如 何 工 作 的 ， 本 节 将 给 出 用 Java 编写 的 一 些 短 代码 例子 。 
在 这 些 例 子 中 ， 请 注意 不 同 版 本 Java 的 字 节 码 清单 细节 会 存在 些许 差异 。 

1. 示例 : 两 个 整数 相 加 

下 面 的 Java 源 代码 行 实现 两 个 整数 相 加 ， 并 将 和 数 保存 在 第 三 个 变量 中 : 


int A = 3; 
int B = 2; 
int sum = 0; 
sum = A+ B; 


该 Java 代码 的 反 汇 编 如 下 : 


iconst 3 
istore 0 
iconst 2 
istore_1 
iconst 0 
istore 2 
iload 0 
iload 1 
iadd 
istore 2 


每 个 编号 行 表示 一 条 Java 字 节 码 指令 的 字 节 偏 移 量 。 本 例 中 ， 可 以 发 现 每 条 指令 都 只 
占 一 个 字 节 ， 因 为 指令 偏 移 量 的 编号 是 连续 的 。 

尽管 字 节 码 反 汇编 一 般 不 包括 注释 ， 这 里 还 是 会 将 注释 添加 上 去 。 虽 然 局 部 变量 在 运行 
时 堆栈 中 有 专门 的 保留 区 域 ， 但 是 指令 在 执行 算术 运算 和 数据 传送 时 还 会 使 用 另 一 个 堆栈 ， 
即 操作 数 栈 。 为 了 避免 在 这 两 个 堆栈 间 产 生 混淆 ， 将 用 索引 值 来 指 代 变量 位 置 ， 如 0、1、2 等 。 

现在 来 仔细 分 析 刚 才 的 字 节 码 。 开 始 的 两 条 指令 将 一 个 常数 值 压 人 操作 数 栈 ， 并 把 同一 
个 值 弹出 到 位 置 为 0 的 局 部 变量 : 


0: iconst 3  // 常数 (3) 压 入 操作 数 栈 
1: istore 0  // 弹出 到 局 部 变量 0 


接 下 来 的 四 行将 其 他 两 个 常数 压 人 操作 数 栈 ， 并 把 它们 弹出 到 位 置 分 别 为 1 和 2 的 局 部 


© 
9 


[Ed 
”whe a OR 


0 
“0 


2: iconst 2 // 常数 (2) 压 入 操作 数 栈 
3: istore 1  // 弹出 到 局 部 变量 1 
4: iconst_ 0  // 常数 (0) 压 入 操作 数 栈 
5 istore 2 // 弹出 到 局 部 变量 2 
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由 于 已 经 知道 了 该 生成 字 节 码 的 Java 源 代 码 ， 因 此 ， 很 明显 下 表 列 出 的 是 三 个 变量 的 
位 置 索 引 : 

接 下 来 ， 为 了 实现 加 法 ， 必 须 将 两 个 操作 数 压 人 操作 数 
栈 。 指 令 iload_0 将 变量 A 人 栈 ， 指 令 iload_1 对 变量 B 进 
行 相同 的 操作 : : 

6: iload 0 //(A 入 栈 ) 

7: iload 1 //(B 入 栈 ) 


现在 操作 数 栈 包 含 两 个 数 : 





(B) << 一 栈 项 
(A) 


这 里 并 不 关心 这 些 例子 的 实际 机 器 表示 ， 因 此 上 图 中 的 运行 时 堆栈 是 向 上 生长 的 。 每 个 
堆栈 示意 图 中 的 最 大 值 即 为 栈 顶 。 
指令 iadd 将 栈 项 的 两 个 数 相 加 ， 并 把 和 数 压 人 堆栈 : 


8: iadd 


操作 数 栈 现在 包含 的 是 A、B 的 和 数 : 


En 
指令 istore_2 将 栈 顶 内 容 弹 出 到 位 置 为 2 的 变量 ， 其 变量 名 为 sum: 


9: istore 2 


操作 数 栈 现在 为 空 

2. 示例 : 两 个 Double 类 型 数据 相 加 

下 面 的 Java 代码 片段 实现 两 个 double 类 型 的 变量 相 加 ， 并 将 和 数 保存 到 sum。 它 执行 
的 操作 与 两 个 整数 相 加 示例 相同 ， 因 此 这 里 主要 关注 的 是 整数 处 理 与 double 处 理 的 差异 : 


double A = 3.1; 
double B = 2; 
double sum = A+ B; 


本 例 的 反 汇编 字 节 码 如 下 所 示 ， 用 javap 实用 程序 可 以 在 右边 插入 注释 : 


ldc2 w #20; // double 3.1d 
dstore_0 

ldc2 w #22; // double 2.0d 
dstore 2 

dload 0 

dload 2 

0: dadd 

1l: dstore 4 


疡 FiD oo ~ 上 山口 
ee ee 00 es ee 


下 面 对 这 个 代码 进行 分 步 讨论 。 偏 移 量 为 0 的 指令 1dc2_w 把 一 个 浮 点 常数 (3.1 ) 从 常 
数 池 压 人 操作 数 栈 。ldec2 指令 总 是 用 两 个 字 节 作为 常数 池 区 域 的 索引 : 


0: ldc2 w #20; // double 3.1d 


偏 移 量 为 3 的 dstore 指令 从 堆栈 弹出 一 个 double 数 ， 送 入 位 置 为 0 的 局 部 变量 。 该 指 
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令 起 始 偏 移 量 (3 ) 反映 出 第 一 条 指令 占用 的 字 节 数 (操作 码 加 上 两 字 节 索引 ): 
3: dstore 0 // 保存 到 A 


同样 ， 接 下 来 偏 移 量 为 4 和 7 的 两 条 指令 对 变量 B 进行 初始 化 : 


4: ldc2 w #22; // double 2.0d 
7: dstore 2 // 保存 到 B 


指令 dload_0 和 dload 2 把 局 部 变量 入 栈 ， 其 索引 指 的 是 64 位 位 置 (两 个 变量 栈 项 )， 
因为 双 字 数值 要 占用 8 个 字 节 : 


8: dload 0 

9: dload 2 

接 下 来 的 指令 (dadd) 将 栈 顶 的 两 个 double 值 相 加 ， 并 把 和 数 人 栈 : 
10: dadd 


最 后 ， 指 令 dstore_4 把 栈 项 内 容 弹 出 到 位 置 为 4 的 局 部 变量 : 


11: dstore_4 


8.7.4 示例 : 条 件 分 支 


了 解 JVM 怎样 处 理 条 件 分 支 是 理解 Java 字 节 码 的 重要 一 环 。 比 较 操 作 总 是 从 堆栈 栈 项 
弹出 两 个 数据 ， 对 它们 进行 比较 后 ， 再 把 结果 数值 人 栈 。 条 件 分 支 指令 常常 跟 在 比较 操作 的 
后 面 ， 利 用 栈 顶 数值 决定 是 否 分 支 到 目标 标号 。 比 如 ， 下 面 的 Java 代码 包含 一 个 简单 的 下 
语句 ， 它 将 两 个 数值 中 的 一 个 分 配给 一 个 布尔 变量 : 

double A = 3.0; 

boolean result = false; 


| 
result = false; 
else 
result = true; 


该 Java 代码 对 应 的 反 汇 编 如 下 所 示 : 

0 ldc2 w #26; // double 3.0d 

3: dstore 0 // 弹出 到 A 

4: iconst 0 // false = 0 

5 istore 2 // 保存 到 result 

6: dload 0 

7s ldc2 w #22:; // double 2.0d 

10: dcmpl 

11: ifle 19 // 如 果 A 夺 2.0， 转 到 19 
14: iconst 0 // false 

15: istore 2 // result = false 
16: goto 21 // 跳 过 后 面 两 条 语句 

19s iconst 1 // true 

20: istore 2 // result = true 
开始 的 两 条 指令 将 3.0 从 常数 池 复 制 到 运行 时 堆栈 ， 再 把 它 从 堆栈 弹出 到 变量 A: 
0: ldc2 w #26; // double 3.0d 


3: dstore 0 // 弹出 到 A 
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接 下 来 的 两 条 指令 将 布尔 值 false (等 于 0 ) 从 常量 区 复制 到 堆栈 ， 再 把 它 弹 出 到 变量 


result: 


4: iconst _0 // false = 0 

5: istore 2 // 保存 到 result 

A 的 值 (位 置 0 ) 压 人 操作 数 栈 ， 数 值 2.0 紧 跟 其 后 人 栈 : 
6: dload 0 // 有 入 栈 

7: 1ldec2 w #22; // double 2.0d 

操作 数 栈 现在 有 两 个 数值 : 


Er 


指令 dcmpl 将 两 个 double 数 弹 出 堆栈 进行 比较 。 由 于 栈 顶 的 数值 (2.0 ) 小 于 它 下 面 的 
数值 (3.0 )， 因 此 整数 1 被 压 人 堆栈 。 


10: dcmpl 


如 果 从 堆栈 弹出 的 数值 小 于 等 于 0， 则 指令 ifle 就 分 支 到 给 定 的 偏 移 量 : 


11: ifle 19 // 如 果 stack.pop() 和 0， 转 到 19 


这 里 要 回顾 一 下 之 前 给 出 的 Java 源 代 码 示 例 ， 若 A>2.0， 其 分 配 的 值 为 false: 


LE BK> ad 
result = false; 
else 
result = true; 


如 果 A 和 2.0，Java 字 节 码 就 把 下 语句 转向 偏 移 量 为 19 的 语句 ， 为 result 分 配 数 值 
true。 与 此 同时 ， 如 果 不 发 生 到 偏 移 量 19 的 分 支 ， 则 由 下 面 几 条 指令 把 false 赋 给 result: 


14: iconst 0 // false 

15s istore 2 // result = false 

16: goto 21 // 跳 过 后 面 两 条 指令 

偏 移 量 16 的 指令 goto 跳 过 后 面 两 行 代码 ， 它 们 的 作用 是 给 result 分 配 true: 
19: iconst 1 // true 

20: istore 2 // result = true 

结论 


Java 虚拟 机 的 指令 集 与 x86 处 理 器 系列 的 指令 集 有 很 大 的 不 同 。 它 采用 面向 堆栈 的 方法 
实现 计算 、 比 较 和 分 支 ， 与 x86 指令 经 常 使 用 寄存 器 和 内 存 操作 数 形成 了 鲜明 的 对 比 。 虽 然 
字 节 码 的 符号 反 汇编 不 如 x86 汇编 语言 简单 ， 但 是 ,编译 器 生成 字 节 码 也 是 相当 容易 的 。 每 
个 操作 都 是 原子 的 ， 这 就 意味 着 它 只 执行 一 个 操作 。 若 JVM 使 用 的 是 实时 编译 器 ， 则 Java 
字 节 码 只 要 在 执行 前 转换 为 本 地 机 器 语言 即 可 。 就 这 方面 来 说 ，Java 字 节 码 与 基于 精简 指令 
集 (RISC) 模型 的 机 器 语言 有 很 多 共同 点 。 


8.8 本 章 小 结 
过 程 参数 有 两 种 基本 类 型 : 寄存 器 参数 和 堆栈 参数 。Irvine32 和 Irvine64 链接 库 使 用 寄 
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存 器 参数 ， 为 程序 执行 速度 进行 了 优化 。 但 是 ， 寄 存 器 参数 往往 在 调用 程序 时 使 代码 变 得 混 
乱 。 堆 栈 参数 是 另 一 种 选择 ， 其 过 程 的 实际 参数 必须 由 主 调 程序 压 人 堆栈 。 

堆栈 帧 (或 活动 记录 ) 是 为 过 程 返回 地 址 、 传 递 参 数 、 局 部 变量 和 被 保存 寄存 器 预 留 的 
堆栈 区 域 。 运 行 中 的 程序 在 开始 执行 过 程 的 时 候 就 会 创建 堆栈 帧 。 

当 过 程 参 数 的 副本 人 栈 时 ， 该 参数 是 通过 值 来 传递 的 。 如 果 是 参数 地 址 人 栈 ， 那 么 它 是 
通过 引用 来 传递 的 ; 过 程 可 以 利用 地 址 来 修改 变量 。 数 组 应 该 通过 引用 传递 ， 以 避免 将 所 有 
的 数组 元 素 人 栈 。 

EBP 寄存 器 间接 寻 址 可 以 访问 过 程 参 数 ， 形 如 [ebp+8] 的 表达 式 能 对 堆栈 参数 进行 高 级 
控制 。 指 令 LEA 返回 任何 类 型 间接 操作 数 的 偏 移 量 ， 它 非常 适合 与 堆栈 参数 一 起 使 用 。 

ENTER 指令 完成 堆栈 帧 ， 方 法 是 将 EBP 入 栈 并 为 局 部 变量 预 留 空间 。LEAVE 指令 结 
束 过 程 的 堆栈 帧 ， 方 法 是 执行 其 之 前 ENTER 指令 的 逆 操 作 。 

直接 或 间接 调用 自身 的 子 程序 即 为 递归 子 程序 。 递 归 过 程 ， 调 用 递归 子 程序 的 实践 ， 在 
处 理 具有 重复 模式 的 数据 结构 时 ， 是 一 种 强 有 力 的 工具 。 

LOCAL 伪 指 令 在 过 程 内 部 声明 一 个 或 多 个 局 部 变量 ， 它 必须 紧 跟 在 PROC 伪 指令 的 后 
面 。 与 全 局 变量 相 比 ， 局 部 变量 有 独特 优势 : 

e 对 局 部 变量 名 和 内 容 的 访问 可 以 被 限制 在 包含 它 的 过 程 之 内 。 局 部 变量 对 程序 调试 

也 有 帮助 ， 因 为 只 有 少数 几 条 程序 语句 才能 修改 它们 。 

e 局 部 变量 的 生命 周期 受 限于 包含 它 的 过 程 的 执行 范围 。 局 部 变量 能 有 效 利用 内 存 ， 

因为 同样 的 存储 空间 还 可 以 被 其 他 变量 使 用 。 

e 同一 个 变量 名 可 以 被 多 个 过 程 使 用 ， 而 不 会 发 生命 名 冲突 。 

e 递归 过 程 可 以 用 局 部 变量 在 堆栈 中 保存 数值 。 如 果 使 用 的 是 全 局 变量 ， 那 么 每 次 过 

程 调 用 自身 时 ， 这 些 数值 就 会 被 覆盖 。 

INVOKE 伪 指 令 〈 仅 限 32 位 模式 ) 能 代替 CALL 指令 ， 它 的 功能 更 加 强大 ， 可 以 传递 
多 个 参数 。 用 INVOKE 伪 指 令 定 义 过 程 时 ，ADDR 运算 符 可 以 传递 指针 。 

PROC 伪 指 令 在 声明 过 程 名 的 同时 可 以 带 上 已 命名 参数 列表 。PROTO 伪 指 令 为 现 有 过 
程 创 建 原型 ， 原 型 声明 过 程 的 名 称 和 参数 列表 。 

当 应 用 程序 全 部 的 源 代码 都 在 一 个 文件 中 时 ， 不 论 该 程序 有 多 大 都 是 难以 管理 的 。 更 实 
用 的 方法 是 ， 将 程序 分 割 为 多 个 源 代码 文件 〈 称 为 模块 )， 使 每 个 文件 都 易于 查看 和 编辑 。 

Java 字 节 码 ”Java 字 节 码 是 指 编译 好 的 Java 程序 中 使 用 的 机 器 语言 。Java 虚拟 机 (JVM) 
是 执行 已 编译 Java 字 节 码 的 软件 。 在 Java 字 节 码 中 ,每 条 指令 都 有 一 个 字 节 的 操作 码 ， 其 后 
跟 零 个 或 多 个 操作 数 。JVM 使 用 面向 堆栈 的 模式 来 执行 算术 运算 、 数 据 传送 、 比 较 和 分 支 。 
Java 开发 工具 包 (JDK) 包含 的 工具 javap.exe 可 以 显示 java.class 文件 中 字 节 码 的 反 汇 编 。 


8.9 关键 术语 


8.9.1 术语 

activation record (活动 记录 ) ) epilogue (结尾 ) 

argument (实际 参数 ) explicit stack parameters ( 显 式 堆栈 参数 ) 
calling convention (调用 规范 ) Java bytecodes (Java 字 节 码 ) 


effective address (有 效 地 址 ) Java Development Kit (JDK)(Java 开发 工具 包 ) 
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Jave Virtual Machine (JVM) Java 虚拟 机 ) 

just-in-time compilation (实时 编译 ) 

local variables (局 部 变量 ) 

memory model (内 存 模式 ) 

Microisoft x64 calling convention ( Microsoft x64 
调用 规范 ) 

operand stack (操作 数 栈 ) 

parameter (形式 参数 ) 

passing by reference (引用 传递 ) 

passing by value ( 值 传递 ) 


8.9.2 指令、 运算 符 和 伪 指令 


ADDR 
ENTER 
INVOKE 
LEA 
LEAVE 


8.10 复习 题 和 练习 


8.10.1 简 答题 
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procedure prototype (过 程 原型 ) 

prologue (开始 ) 

recursion (递归 ) 

recursive subroutine (递归 子 程序 ) 

stack frame (堆栈 帧 ) 

STDCALL calling convention (STDCALL 调用 
规范 ) 

reference parameter (引用 参数 ) 

stack parameter (堆栈 参数 ) 

subroutine ( 子 程序 ) 


1. 若 过 程 有 堆栈 参数 和 局 部 变量 ， 那 么 在 其 结尾 部 分 应 包含 哪些 语句 ? 


2. 当 C 函数 返回 32 位 整数 时 ， 返 回 值 保存 在 哪里 ? 


3. 使 用 STDCALL 调用 规范 的 程序 在 过 程 调用 之 后 如 何 清除 堆栈 ? 


4. 为 什么 LEA 指令 比 OFFSET 运算 符 功 能 更 强 ? 


5. 在 8.2.3 节 给 出 的 C++ 示例 中 ,一 个 int 类 型 的 变量 需 占用 多 少 堆栈 空间 ? 

6. 与 STDCALL 调用 规范 相 比 ，C 调用 规范 会 有 哪些 优势 ? 

7.( 真 / 假 ): 使 用 PROC 伪 指 令 时 ， 所 有 参数 必须 列 在 同一 行 上 。 

8. ( 真 / 假 ): 若 向 一 个 期 望 接收 字数 组 指针 的 过 程 传递 的 变量 包含 的 是 字 节 数组 偏 移 量 ， 则 汇编 器 会 将 


其 标志 为 错误 。 


9.( 真 / 假 ): 若 向 一 个 期 望 接收 引用 参数 的 过 程 传递 了 立即 数 ， 则 会 产生 一 般 保护 错误 。 


8.10.2 算法 基础 


1. 下 面 是 过 程 AddThree 的 调用 指令 序列 ， 该 过 程 实现 三 个 双 字 的 加 法 (假设 使 用 的 是 STDCALL 调 


用 规范 ): 


push 10h 
push 20h 
push 30h 
call AddThree 


请 画 出 EBP 被 压 信 运行 时 堆栈 后 过 程 堆栈 帧 的 示意 图 。 
2. 新 建 过 程 AddThree， 接 收 三 个 整 型 参数 ， 计 算 并 用 EAX 寄存 器 返回 它们 的 和 。 


3. 声 明 局 部 变量 pArray 作为 双 字数 组 的 指针 。 
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4. 声 明 局 部 变量 buffer 作为 含有 20 个 字 节 的 数组 。 

5. 声明 局 部 变量 pwArray 指向 一 个 16 位 无 符号 整数 。 

6. 声明 局 部 变量 myByte 包含 一 个 8 位 有 符号 整数 。 

7. 声明 局 部 变量 myArray 作为 含有 20 个 双 字 的 数组 。 

8. 新 建 过程 SetColor 接收 两 个 堆栈 参数 : 前 景色 和 背景 色 ， 并 调用 Irvine32 链接 库 的 SetTextColor 


过 程 。 
9. 新 建 过 程 WriteColorChar 接收 三 个 堆栈 参数 : 字符 、 前 景色 和 背景 色 。 该 过 程 用 指定 的 前 景色 和 背 
景色 显示 单个 字符 。 


10. 编写 过 程 DumpMemory 封装 Irvine32 链接 库 的 DumpMem 过 程 。 要 求 使 用 已 声明 的 参数 和 USES 
伪 指 令 。 该 过 程 被 调用 的 示例 为 : INVOKE DumpMemory、OFFSET array、LENGTHOF array、 
TYPE array。 

11. 声明 过 程 MultArray， 接 收 两 个 双 字 数组 指针 ， 以 及 表示 数组 元 素 个 数 的 参数 。 同 时 ， 为 该 过 程 创 
建 PROTO 声明 。 


8.11 编程 练习 


*1. FindLargest 过 程 
新 建 过 程 FindLargest 接收 两 个 参数 : 一 个 是 有 符号 双 字 数组 指针 ， 另 一 个 是 该 数组 长 度 的 计 
数 器 。 过 程 必须 用 EAX 返回 数组 中 最 大 元 素 的 值 。 声 明 过 程 要 求 使 用 带 参数 列表 的 PROC 伪 指 
令 。 保 存 所 有 会 被 该 过 程 修改 的 寄存 器 (EAX 除外 )。 编 写 测 试 程序 调用 FindLargest， 并 向 其 传递 
三 个 长 度 不 同 的 数组 ， 这 些 数组 中 的 元 素 应 含有 负数 。 为 FindLargest 新 建 PROTO 声明 。 
* 2. 棋盘 
编写 程序 画 一 个 8 x 8 的 棋盘 ， 盘 面 为 相互 交替 的 灰色 和 白色 方块 。 编 程 时 可 以 使 用 Irvine32 
链接 库 的 SetTextColor 和 Gotoxy 过 程 ， 不 要 使 用 全 局 变量 ,使 用 每 个 过 程 中 声明 的 参数 。 每 个 过 
程 只 完成 单一 任务 ， 以 尽 可 能 地 简短 。 
*** 3. 变色 棋盘 
本 题 是 习题 2 的 延伸 。 每 隔 500 毫秒 ， 有 颜色 的 方块 变色 并 再 次 显示 棋盘 。 使 用 所 有 可 能 的 4 
位 背景 色 ， 重 复 该 过 程 直到 显示 棋盘 16 次 。( 整 个 过 程 中 白色 方块 保持 不 变 。) 
**4.FindThrees 过 程 
新 建 过 程 FindThrees， 若 数组 存在 三 个 连续 的 数值 3， 过 程 返回 1， 否 则 返回 0。 过程 输入 
参数 列表 包括 : 一 个 数组 指针 和 该 数组 的 长 度 。 过 程 声 明 要 求 使 用 带 参 数列 表 的 PROC 伪 指 令 。 
所 有 会 被 该 过 程 修改 的 寄存 器 都 需 保 存 ( EAX 除外 )。 编 写 一 个 测试 程序 用 不 同 的 数组 多 次 调用 
FindThree。 
** 5.Differentlnputs 过 程 
编写 过 程 DifferentInputs， 若 其 三 个 输入 参数 不 同 ， 则 返回 EAX=1 ; 否则 返回 EAX=0。 过 程 
声明 要 求 使 用 带 参数 列表 的 PROC 伪 指 令 ， 并 为 过 程 新 建 PROTO 声明 。 编 写 测试 程序 ， 用 不 同 的 
输入 值 调用 过 程 5 次 。 
*x6. 整数 交换 
创建 一 个 随机 排序 整数 数组 。 使 用 8.4.6 节 的 Swap 过 程 ， 编 写 循 环 代码 段 实现 数组 中 每 一 对 
连续 整数 的 交换 。 
** 7. 最 大 公约 数 
编写 Euclid 算法 的 递归 实现 ， 找 出 两 个 整数 的 最 大 公约 数 (GCD)。 在 代数 书 中 和 网 上 都 可 
以 找到 Euclid 算法 的 解释 说 明 。 编 写 测试 程序 调用 该 GCD 过 程 $ 次 ， 要 求 使 用 如 下 整数 对 : ( 5， 
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20)、(24，18)、(11，7)、(432，226 )、( 26，13 )。 每 次 调用 过 程 后 ， 显 示 找 到 的 GCD。 


**8. 相等 数组 元 素 计 数 器 


编写 过 程 CountMatches 接收 两 个 有 符号 双 字 数组 指针 、 表 示 两 个 数组 长 度 的 参数 。 对 第 一 
个 数组 中 的 每 个 元 素 x;， 若 第 二 个 数组 中 相应 元 素 y 与 之 相等 ， 则 计数 器 加 1。 最后， 过程 用 
EAX 返回 相等 数组 元 素 的 个 数 。 编 写 测试 程序 ， 用 两 对 不 同 的 数组 指针 调用 该 过 程 。 要 求 : 使 用 
INVOKE 语句 调用 过 程 并 传递 堆栈 参数 ; 为 CountMatches 创建 PROTO 声明 ; 保存 并 恢复 所 有 会 
被 该 过 程 修改 的 寄存 器 (EAX 除外 )。 


*** 9. 近似 相等 元 素 计 数 器 


编写 过 程 CountNearMatches 接收 两 个 有 符号 双 字 数组 指针 、 表 示 两 个 数组 长 度 的 参数 和 表示 
两 个 匹配 元 素 间 最 大 允许 误差 ( 称 为 diff) 的 参数 。 对 第 一 个 数组 中 的 每 个 元 素 x;,， 若 第 二 个 数组 
中 相应 元 素 y 与 它 的 误差 小 于 等 于 dift， 则 计数 器 加 1。 最后， 过程 用 EAX 返回 近似 相等 数组 元 素 
的 个 数 。 编 写 测试 程序 ， 用 两 对 不 同 的 数组 指针 调用 该 过 程 。 要 求 : 使 用 INVOKE 语句 调用 过 程 
并 传递 堆栈 参数 ， 为 CountNearMatches 创建 PROTO 声明 ; 保存 并 恢复 所 有 会 被 该 过 程 修改 的 寄 
存 器 (EAX 除外 )。 


**t* 10. 显示 过 程 参数 
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编写 过 程 ShowParams， 显 示 被 调用 过 程 运行 时 堆栈 中 32 位 参数 的 地 址 和 十 六 进 制 数 值 。 参 
数 按照 从 低地 址 到 高 地 址 的 顺序 显示 。 过 程 输入 只 有 一 个 整数 ， 用 以 表示 显示 参数 的 个 数 。 比 如 ， 
假设 下 述 main 中 的 语句 调用 了 MySample， 并 传递 了 三 个 参数 : 


INVOKE MySample, 1234h, 5000h, 6543h 


然后 ， 在 MySample 内 部 就 可 以 调用 ShowParams， 并 向 其 传递 希望 显示 的 参数 个 数 : 


MySample PROC first:DWORD, second:DWORD, third:DWORD 
paramCount = 3 
call ShowParams, paramCount 


ShowParams 将 按 如 下 格式 显示 输出 : 


Stack parameters: 

Address 0012FF80 = 00001234 
Address 0012FF84 = 00005000 
Address 0012FF88 = 00006543 


| 第 9 章 


Assembly Language for x86 Processors, Seventh Edition 


字符 串 和 数组 





9.1 引 盲 


如 果 学 会 有 效 地 处 理 字符 串 和 数组 ， 就 能 够 掌握 代码 优化 中 最 常见 的 情况 。 研 究 表明 ， 
绝 大 多 数 程序 用 90% 的 运行 时 间 执 行 其 10% 的 代码 。 训 无 疑问 ， 这 10% 通常 发 生 在 循环 
中 ， 而 循环 正 是 处 理 字符 串 和 数组 所 要 求 的 结构 。 本 章 以 编写 高 效 代 码 为 目的 ， 阅 释 字 符 申 
和 数组 处 理 技 术 。 

本 章 首先 介绍 字符 串 基 本 指令 ， 它 们 针对 数据 块 的 传送 、 比 较 、 加 载 和 保存 进行 过 优 
化 。 然 后 是 Irvine32 和 Irvine64 链接 库 的 几 个 字符 串 处 理 过 程 ， 它 们 的 实现 与 标准 C 字符 
串 库 中 的 实现 非常 相似 。 本 章 第 三 部 分 展示 如 何 利 用 高 级 间接 寻 址 方式 一 一 基 址 变 址 和 相对 
基 址 变 址 一 一 操作 二 维 数组 。 简 单 的 间接 寻 址 已 经 在 4.4 节 中 介绍 过 了 。 

9.5 节 ， 整 数 数 组 的 检索 和 排序 ， 是 本 章 最 有 趣 的 部 分 。 读 者 将 会 发 现 ， 对 于 计算 机 科 
学 中 两 种 常用 的 基本 数组 处 理 算法 : 冒 泡 排序 和 对 半 查 找 ， 要 实现 它们 是 多 么 容易 。 除 了 汇 
编 语言 外 ， 研 究 这 些 算 法 在 Java 或 C++ 中 的 实现 也 是 很 有 益处 的 。 


9.2 字符 串 基 本 指令 


x86 指令 集 有 五 组 指令 用 于 处 理 字 节 、 字 和 双 字 数组 。 虽 然 它 们 被 称 为 字符 串 原 语 
( string primitives)， 但 它们 并 不 局 限于 字符 数组 。32 位 模式 中 ， 表 9-1 中 的 每 条 指令 都 隐 含 
使 用 ESI、EDI， 或 是 同时 使 用 这 两 个 寄存 器 来 寻 址 内 存 。 根 据 指令 数据 大 小 ， 对 累加 器 的 
引用 隐 含 使 用 AL、AX 或 EAX。 字 符 串 原 语 能 高 效 执行 ， 因 为 它们 会 自动 重复 并 增加 数组 
索引 。 
表 9-1 字符 串 基本 指令 


指令 说 明 
MOVSB、MOVSW、MOVSD 传送 字符 串 数据 : 将 ESI 寻 址 的 内 存 数据 复制 到 EDI 寻 址 的 内 存 位 置 
CMPSB、 CMPSW、 CMPSD 比较 字符 串 : 比较 分 别 由 ESI 和 EDI 寻 址 的 内 存 数据 
SCASB、SCASW、SCASD 扫描 字符 串 : 比较 累加 器 (AL、AX 或 EAX) 与 EDI 寻 址 的 内 存 数据 
STOSB、STOSW、STOSD 保存 字符 串 数据 : 将 累加 器 内 容 保 存 到 EDI 寻 址 的 内 存 位 置 
LODSB、 LODSW、 LODSD 从 字符 串 加 载 到 累加 器 : 将 ESI 寻 址 的 内 存 数据 加 载 到 累加 器 


使 用 重复 前 缀 ”就 其 自身 而 言 ， 字 符 串 基本 指令 只 能 处 理 一 个 或 一 对 内 存 数值 。 如 果 加 
上 重复 前 级 ， 指 令 就 可 以 用 ECX 作 计 数 器 重复 执行 。 重 复 前 缀 使 得 单条 指令 能 够 处 理 整 个 
数组 。 下 面 为 可 用 的 重复 前 缀 : 

ECX > 0 时 重复 


REPZ、REPE 零 标 志 位 置 1 且 ECX > 0 时 重复 
REPNZ、REPNE 零 标志 位 清 零 旦 ECX > 0 时 重复 


示例 : 复制 字符 串 “下面 的 例子 中 ，MOVSB 从 stringl 传送 10 个 字 节 到 string2。 重 复 
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前 缀 在 执行 MOVSB 指令 之 前 ， 首 先 测试 ECX 是 否 大 于 0。 若 ECX=0，MOVSB 指令 被 忽 
略 ， 控 制 传递 到 程序 的 下 一 行 代码 ; 若 ECX > 0， 则 ECX 减 1 并 重复 执行 MOVSB 指令 ; 
cld ; 清除 方向 标志 位 
mov esi,OFFSET stringl ;ESI 指 向 源 串 
mov edi,OFFSET string2 ;EDI 执行 是 的 串 


mov ecx,10 ; 计数 器 赋值 为 10 
rep movsb ; 传送 10 个 字 节 


重复 MOVSB 指令 时 ，ESI 和 EDI 自动 增加 ， 这 个 操作 由 CPU 的 方向 标志 位 控制 。 
方向 标志 位 根据 方向 标志 位 的 状态 ， _ 
字符 串 基本 指令 增加 或 减少 ESI 和 EDI (参见 ”_ 表 9-2_ 字 符 串 基本 指令 中 方向 标志 位 的 用 法 


表 9-2 )。 可 以 用 CLD 和 STD 指令 显 式 修改 方向 标志 位 的 值 | 对 ESI 和 EDI 的 影响 | 地 址 顺序 
= 0 | 增 m | 低 到 高 
方向 标志 位 : 
1 | 减 》 | 高 到 低 
CLD ;方向 标志 位 清 零 ( 正 向 ) 
STD ;方向 标志 位 置 1( 反 向 ) 


在 执行 字符 串 基 本 指令 之 前 ， 若 忘记 设置 方向 标志 位 会 产生 大 麻烦 ， 因 为 ESI 和 EDI 
寄存 器 可 能 无 法 按 预 期 增加 或 减少 。 


9.2.1 MOVSB、MOVSW 和 MOVSD 


MOVSB、MOVSW 和 MOVSD 指令 将 数据 从 ESI 指向 的 内 存 位 置 复制 到 EDI 指向 的 内 
存 位 置 。( 根 据 方向 标志 位 的 值 ) 这 两 个 寄存 器 自动 地 增加 或 减少 : 


MOVSB 传送 (复制 ) 字 节 
MOVSW 传送 (复制 ) 字 
MOVSD 传送 (复制 ) 双 字 


MOVSB、MOVSW 和 MOVSD 可 以 使 用 重复 前 级 。 方 向 标志 位 决定 ESI 和 EDI 是 否 增 
加 或 减少 。 增 加 /减少 的 量 如 下 表 所 示 : 


指令 ESI 和 EDI 增加 或 减少 的 数值 
MOVSB 1 
MOVSW 2 
MOVSD 4 


示例 : 复制 双 字数 组 ”假设 现在 想 从 source 复制 20 个 双 字 整数 到 target。 数 组 复制 完 
成 后 ，ESI 和 EDI 将 分 别 指向 两 个 数组 范围 之 外 的 一 个 位 置 ( 即 超出 4 字 节 ); 


.data 
source DWORD 20 DUP(OFFFFFFFFh) 
target DWORD 20 DUP(?) 


.Code 

cld ;方向 为 正 向 

mov ecx,LENGTHOF source ; 设置 REP 计数 器 
mov esi,OFFSET source ?ESI 指向 source 
mov edi,OFFSET target 7EDI 指向 target 
rep movsd ; 复制 双 字 


9.2.2 CMPSB、CMPSW 和 CMPSD 
CMPSB、CMPSW 和 CMPSD 指令 比较 ESI 指向 的 内 存 操作 数 与 EDI 指向 的 内 存 操 作 数 : 
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CMPSB 比较 字 节 
CMPSW 比较 字 
CMPSD 比较 双 字 


CMPSB、CMPSW 和 CMPSD 可 以 使 用 重复 前 级 。 方 向 标志 位 决定 ESI 和 EDI 的 增加 
示例 : 比较 双 字 假设 现在 想 用 CMPSD 比较 两 个 双 字 。 下 例 中 ，source 的 值 小 于 
target， 因 此 JA 指令 不 会 跳 转 到 标号 L1。 


.data 

source DWORD 1234h 

target DWORD 5678h 

-Code 

mov esi,OFFSET source 

mov edi,OFFSET target 

cmpsd ; 比较 双 字 

| Ti ; 若 source > target 则 跳 转 


比较 多 个 双 字 时 ， 清 除 方向 标志 位 ( 正 向 )，ECX 初始 化 为 计数 器 ， 并 给 CMPSD 添加 
重复 前 级 : 
mov esi,OFFSET source 


mov edi,OFFSET target 
cld 


;方向 为 正 向 
mov ecx,LENGTHOF source ; 设置 重复 计数 器 
repe cmpsd ; 相等 则 重复 
REPE 前 级 重复 比较 操作 ， 并 自动 增加 ESI 和 EDI， 直 到 ECX 等 于 0, 或 者 发 现 了 一 对 
不 相等 的 双 字 。 [355] 





9.2.3 SCASB、SCASW 和 SCASD 


SCASB、SCASW 和 SCASD 指令 分 别 将 AL/AX/EAX 中 的 值 与 EDI 寻 址 的 一 个 字 
节 / 字 / 双 字 进行 比较 。 这 些 指令 可 用 于 在 字符 串 或 数组 中 寻找 一 个 数值 。 结 合 REPE (或 
REPZ) 前 级， 当 ECX > 0 且 AL/AX/EAX 的 值 等 于 内 存 中 每 个 连续 的 值 时 ， 不 断 扫 描 
字符 串 或 数组 。REPNE 前 级 也 能 实现 扫描 ， 直 到 AL/AX/EAX 与 某 个 内 存 数 值 相 等 或 者 
ECX=0。 

扫描 是 否 有 匹配 字符 ”下面 的 例子 扫描 字符 串 alpha， 在 其 中 寻找 字符 F。 如 果 发 现 该 
字符 ， 则 EDI 指向 匹配 字符 后 面 的 一 个 位 置 。 如 果 未 发 现 匹 配 字符 ， 则 JNZ 执行 退出 : 


.data 

alpha BYTE "ABCDEFGH" ,0 

Code 

mov edi,OFFSET alpha ;EDI 指向 字符 串 
mov al,'F' ; 检索 字符 下 

mov ”ecx,LENGTHOF alpha ; 设置 检索 计数 器 
cld ; 方向 为 正 向 

repne scasb 7 不 相等 则 重复 

jnz :quit ; 若 未 发 现 字符 则 退出 
dec edi ; 发 现 字 符 : EDI 减 1 


循环 之 后 添加 了 JNZ， 以 测试 由 于 ECX=0 且 没 有 找到 AL 中 的 字符 而 结束 循环 的 可 
能 性 。 
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9.2.4 STOSB、STOSW 和 STOSD 


STOSB、STOSW 和 STOSD 指令 分 别 将 AL/AX/EAX 的 内 容 存 人 由 EDI 中 偏 移 量 指 向 
的 内 存 位置 。EDI 根据 方向 标志 位 的 状态 递增 或 递减 。 与 REP 前 缀 组 合 使 用 时 ， 这 些 指令 
实现 用 同一 个 值 填充 字符 串 或 数组 的 全 部 元 素 。 例 如 ， 下 面 的 代码 就 把 string1 中 的 每 一 个 
字 节 都 初始 化 为 OFFh: 


.data 
Count = 100 
stringl BYTE Count DUP(?) 


:Code 

mov al,OrFh ; 要 保存 的 数值 

mov edi,OFFSET stringl ;EDI 指向 目标 字符 囊 
mov ecx,Count ; 字符 计数 器 

cld 7 方向 为 正 向 

rep stosb ; 用 AL 的 内 容 实 现 填 充 


9.2.5 LODSB、LODSW 和 LODSD 


LODSB、LODSW 和 LODSD 指令 分 别 从 ESI 指向 的 内 存 地 址 加 载 一 个 字 节 或 一 个 字 
到 AL/AX/EAX。ESI 按照 方向 标志 位 的 状态 递增 或 递减 。LODS 很 少 与 REP 前 弘一 起 使 用 ， 
原因 是 ， 加 载 到 累加 器 的 新 值 会 覆盖 其 原来 的 内 容 。 相 对 而 言 ，LODS 常常 被 用 于 加 载 单个 
数值 。 在 后 面 的 例子 中 ，LODSB 代替 了 如 下 两 条 指令 (假设 方向 标志 位 清 零 ): 

mov al,[esil] ; 将 字 节 送 入 AL 

inc esi ; 指向 下 一 个 字 节 

数组 乘法 示例 下 面 的 程序 把 一 个 双 字 数组 中 的 每 个 元 素 都 乘 以 同一 个 常数 。 程 序 同时 
使 用 了 LODSD 和 STOSD: 


; 数组 乘法 (Mult .asm) 
; 本 程序 将 一 个 32 位 整数 数组 中 的 每 个 元 素 都 乘 以 一 个 常数 。 
INCLUDE IFVine32 .inc 

.data 

array DWORD 1,2,3,4,5,6,7,8,9,10 


multiplier DWORD 10 Re 

.Code 

main PROC 
cld ; 方向 为 正 向 
mov esi,OFFSET array ; 源 数组 索引 
mov edi,esi ; 目标 数组 索引 
mov ecx, LENGTHOF array ; 循环 计数 器 

L1: lodsd ; 将 [ESI] 加 载 到 EAX 
mul multiplier ;与 常数 相 乘 
stosd ; 将 EAX 保存 到 [EDI] 
Loop Ll 
exit 

main ENDP 

END main 

9.2.6 ”本 节 回顾 


1. 参照 字符 串 原 语 ， 哪 个 32 位 寄存 器 被 称 为 累加 器 ? 
2. 哪 条 指令 比较 累加 器 中 的 32 位 整数 与 由 EDI 指向 的 内 存 数值 ? 


伞 第 中 和 数组 


3. STOSD 指令 使 用 哪个 变 址 寄存 器 ? 
4. 哪 条 指令 将 数值 从 ESI 指向 的 内 存 地 址 复制 到 AX ? 
5. 对 CMPSB 指令 来 说 ，REPZ 前 缀 的 作用 是 什么 ? 


9.3 ”部 分 字符 串 过 程 


本 节 将 演示 用 Irvine32 链接 库 中 的 几 个 过 程 来 处 理 空 字 节 结束 的 字符 串 。 这 些 过 程 与 标 


准 C 库 中 的 函数 有 着 明显 的 相似 性 : 


; 将 源 串 复制 到 目的 串 。 
Str_copy PROTO, 


SOurce:PTR BYTE, 
target:PTR BYTE 

; 用 EAX 返回 串 长 度 ( 包括 零 字 节 ) 。 

Str_ length PROTO, 
pString:PTR BYTE 

; 比较 字符 串 1 和 字符 串 2。 

; 并 用 与 CMP 指令 相同 的 方法 设置 零 标志 位 和 进位 标志 位 。 

Str compare PROTO, 
stringl:PTR BYTE, 
string2:PTR BYTE 

; 从 字符 串 尾部 去 掉 特定 的 字符 。 

? 第 二 个 参数 为 要 去 除 的 字符 。 

str trim PROTO, 
pString:PTR BYTE, 
char:BYTE 

; 将 字符 串 转换 为 大 写 。 

Str_ucase PROTO, 
pString:PTR BYTE 


9.3.1 ”Str_compare 过 程 
Str_compare 过 程 比较 两 个 字符 串 ， 其 调用 格式 如 下 : 


INVOKE Str compare, ADDR stringl, ADDR string2 


它 从 第 一 个 字 节 开始 按 正 序 比较 字符 串 。 这 种 比较 是 区 分 大 小 写 的 ， 因 为 字母 的 大 写 和 
小 写 ASCII 码 不 相同 。 该 过 程 没 有 返回 值 ， 若 参数 为 stringl 和 string2， 则 进位 标志 位 和 零 


标志 位 的 含义 如 表 9-3 所 示 。 


表 9-3 Str_compare 过 程 影响 的 标志 位 


PTE 


stringl 一 string2 
stringl=string2 
stringl > string2 





参见 6.2.8 节 的 示例 ， 回 顾 CMP 指令 如 何 设置 进 位 标志 位 和 零 标志 位 。 下 面 给 出 了 


Str_compare 过 程 的 代码 清单 。 演 示 参 见 程序 Compare.asm: 


Str compare PROC USES eax edx esi edi, 
stringl:PTR BYTE, 
string2:PTR BYTE 
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址 。 


;? 比较 两 个 字符 串 。 
7 无 返回 值 ， 但 是 零 标 志 位 和 进位 标志 位 受到 的 影响 与 CMP 指令 相同 。 


mov esi,stringl 

mov edi,string2 
Ll: mov al, [esi] 

mov dl,[edil] 


cmp al,0 ;Stringl 结束 ? 

jne L2 和 才 

cmp dl,0 ; 是 : string2 结束 ? 

jne L2 # 香 

jmp L3 ;是 ， 退出 生 ZF=1 
L285  Lne esi ; 指向 下 一 个 字符 

inc edi ; 字符 相等 ? 

cmp al,dl ; 是 : 继续 循环 

je L1 
L3: ret ; 否 : 退出 并 设置 标志 位 


Str_compare ENDP 
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实现 Str_compare 时 也 可 以 使 用 CMPSB 指令 ， 但 是 这 条 指令 要 求知 道 较 长 字符 串 的 长 
度 ， 这 样 就 需要 调用 Str_length 过 程 两 次 。 本 例 中 ， 在 同一 个 循环 内 检测 两 个 字符 串 的 零 结 
束 符 显 得 更 加 容易 。CMPSB 在 处 理 长 度 已 知 的 大 型 字符 串 或 数组 时 最 有 效 。 


9.3.2 Sitr_length 过 程 
Str_length 过 程 用 EAX 返回 一 个 字符 串 的 长 度 。 调 用 该 过 程 时 ， 要 传递 字符 串 的 偏 移 地 


例如 : 

INVOKE Str_ length, ADDR myString 

Str_length PROC USES edi, 
PString:PTR BYTE ; 指向 字符 囊 
mov edi,pSstring ; 字符 计数 器 
mov eax,0 ; 字符 结束 ? 

L1: cmp BYTE PTR[edi],0 _ 
je L2 i 是: 退出 
inc edi ; 否 : 指向 下 一 个 字符 
inc eax ; 计数 器 加 1 
jmp L1 

L2; ret 


Str_length ENDP 


该 过 程 的 演示 参见 程序 Length.asm。 


9.3.3 Str_copy 过 程 


Str_copy 过 程 把 一 个 空 字 节 结 束 的 字符 串 从 源 地 址 复制 到 目的 地 址 。 调 用 该 过 程 之 前 ， 


要 确保 目标 操作 数 能 够 容纳 被 复制 的 字符 串 。Str_copy 的 调用 语法 如 下 : 


INVOKE Str copy, ADDR source, ADDR target 


过 程 无 返回 值 。 下 面 是 其 实现 : 
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下 
StI_Ccopy PROC USES eax ecx esi edi, 
source:PTR BYTE, ; source string 
target:PTR BYTE ; target string 


; 将 字符 囊 从 源 捉 复制 到 目的 囊 。 


INVOKE Str_length,source ;EAX= 源 串 长 度 
mov ecx,eax ; 重复 计数 器 
inc ecx ; 由 于 有 零 字 节 ， 计 数 器 加 1 


mov esi,source 
mov edi,target 


od ;方向 为 正 向 
rep movsb ; 复制 字符 串 


ret 
Str copy ENDP 


该 过 程 的 演示 参见 程序 CopyStr.asm。 
9.3.4 ”Str_trim 过 程 


Str_trim 过 程 从 空 字 节 结 束 字 符 串 中 移 除 所 有 与 选 定 的 尾部 字符 匹配 的 字符 。 其 调用 语 
法 如 下 : 


INVOKE Str trim, ADDR string, char_to_trim 


这 个 过 程 的 逻辑 很 有 意思 ， 因 为 程序 需要 检查 多 种 可 能 的 情况 (以 下 用 # 作为 尾部 字符 ): 

1 ) 字符 串 为 空 。 

2 ) 字符 串 一 个 或 多 个 尾部 字符 的 前 面 有 其 他 字符 ， 如 “Hello#”。 

3 ) 字符 串 只 含有 一 个 字符 ， 且 为 尾部 字符 ， 如 “#”。 

4 ) 字符 串 不 含 尾 部 字符 ,如 “Hello” 或 “H”。 

5 ) 字符 串 在 一 个 或 多 个 尾部 字符 后 面 跟随 有 一 个 或 多 个 非 尾 部 字符 ， 如“#H” 或 
“##Hello” 。 

使 用 Str_trim 过 程 可 以 删除 字符 串 尾部 的 全 部 空格 (或 者 任何 重复 的 字符 )。 从 字符 串 
中 去 掉 字符 的 最 简单 的 方法 是 ， 在 想 要 移 除 的 字符 前 面 插入 一 个 空 字 节 。 空 字 节 后 面 的 任何 
字符 都 会 变 得 无 意义 。 

表 9-4 列 出 了 一 些 有 用 的 测试 例子 。 在 所 有 例子 中 都 假设 从 字符 串 中 删除 的 是 # 字符， 
表 中 给 出 了 期 望 的 输出 。 

现在 来 看 看 测试 Str_trim 过 程 的 代码 。INVOKE 
语句 向 Str_trim 传递 字符 串 地 址 : 


.data 

string 1 BYTE "Hello##",0 

.Code 

INVOKE Str trim,ADDR String 1,'#' 
INVOKE ShowString,ADDR string 1 


Showstring 过 程 用 方 括号 显示 了 被 裁 前 后 的 字符 串 ， 这 里 未 给 出 其 代码 。 过 程 输出 示例 
如 下 : 


[Hello] 


表 9-4 用 分 隔 符 # 测 试 Str_trim 过 程 
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更 多 例子 参见 第 9 章 示例 中 的 Trim.asm。 下 面 给 出 了 Str_trim 的 实现 ， 它 在 想 要 保留 的 最 
后 一 个 字符 后 面 插 人 了 一 个 空 字 节 。 空 字 节 后 面 的 任何 字符 一 般 都 会 被 字符 串 处 理 函 数 所 忽略 。 


; 返回 : 无 


Str trim PROC USES eax ecx edi, 


pstring:PTR BYTE, ; 指向 字符 囊 
char: BYTE ; 要 移 除 的 字符 
mov edi,pString ; 准备 调用 Str_length 
INVOKE Str_ length,edi ; 用 EAX 返回 长 度 
cmp eax,0 ; 长度 是 否 为 零 ? 
1 ; 是 : 立刻 退出 
mov ecx,eax ; 否 : ECX= 字符 囊 长 度 
dec eax 
add edi,eax ; 指向 最 后 一 个 字符 
Ll: mov al,[edil ; 取 一 个 字符 
cmp al,char ;是否 为 分 隔 符 ? 
jne L2 ; 否 : 插入 空 字 节 
dec edi ; 是 : 继续 后 退 一 个 字符 
loop L1 ; 直到 字符 囊 的 第 一 个 字符 
L2: mov BYTE PTR [edi+1],0 ;插入 一 个 空 字 节 
L3s ret 
Stmr trim ENDP 
详细 说 阴 


现在 仔细 研究 一 下 Str_trim。 该 算法 从 字符 串 最 后 一 个 字符 开始 ， 反 向 进行 串 扫 描 ， 以 寻 
找 第 一 个 非 分 隔 符 字符 。 当 找到 这 样 的 字符 后 ， 就 在 该 字符 后 面 的 位 置 上 插入 一 个 空 字 节 : 


ecx = length (str) 
if length(str) > 0 then 
edi = length - 1 
do while ecx > 0 
if str[edi] # delimiter then 
str[edi+1] = null 


break 
else 
edi = edi -1 
end if 
ecx = ecx -1 
end do 


下 面 逐 行 查看 代码 实现 。 首 先 ，pString 为 待 裁剪 字符 串 的 地 址 。 程 序 需要 知道 该 字符 
串 的 长 度 ，Str_length 过 程 用 EDI 寄存 器 接收 其 输入 参数 : 


mov edi,pstring ;准备 调用 Str_length 
INVOKE Str length,edi ; 过 程 返 回 值 在 EAX 中 


Str_length 过 程 用 EAX 寄存 器 返回 字符 串 长 度 ， 所 以 ,后面 的 代码 行将 它 与 零 进行 比 
较 ， 如 果 字 符 串 为 空 ， 则 跳 过 后 续 代 码 : 


cmp eax,0 ; 字符 串 长 度 等 于 零 吗 ? 
je L3 ; 是 : 立刻 退出 


在 继续 后 面 的 程序 之 前 ， 先 假设 该 字符 串 不 为 空 。ECX 为 循环 计数 器 ， 因 此 要 将 字符 
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串 长 度 赋 给 它 。 由 于 希望 EDI 指 向 字符 串 最 后 一 个 字符 ， 因 此 把 EAX (包含 字符 串 长 度 ) 
减 1 后 再 加 到 EDI 上 : 
mov ecx,eax ; 否 ; ECX= 字符 串 长 度 


dec eax 


add edi,eax ; 指向 最 后 一 个 字符 
现在 EDI 指向 的 是 最 后 一 个 字符 ， 将 该 字符 复制 到 AL 寄存 器 ， 并 与 分 隔 符 比 较 ; 


Ll: mov al,[edil] ; 取 字 符 
cmp al,char ; 是 分 隔 符 吗 ? 


如 果 该 字符 不 是 分 隔 符 ， 则 退出 循环 ， 并 用 标号 为 直 2 的 语句 插入 一 个 空 字 节 : 
jne L2 ;? 否 ; 插入 空 字 节 
和 否则， 如果 发 现 了 分 隔 符 ， 则 继续 循环 ， 逆 向 搜索 字符 串 。 实 现 的 方法 为 : 将 EDI 后 


退 一 个 字符 ， 再 重复 循环 : 
dec edi ;是 ; 继续 
loop L1 人 和风 全 个 字符 


如 果 整 个 字符 串 都 由 分 隔 符 组 成 ， 则 循环 计数 器 将 减 到 零 ， 并 继续 执行 loop 指令 下 面 
的 代码 行 ， 即 标号 为 L2 的 代码 ， 在 字符 串 中 插入 一 个 空 字 节 : 


L2: mov BYTE PTR [edi+1],0 7 插入 空 字 节 


假如 程序 控制 到 达 这 里 的 原因 是 循环 计数 减 为 零 ， 那么，EDI 就 会 指向 字符 串 第 一 个 字 
符 之 前 的 位 置 。 因 此 需要 用 表达 式 [edi+1] 来 指向 第 一 个 字符 。 

在 两 种 情况 下 ， 程 序 会 执行 标号 L2 : 其 一 ， 在 字符 串 中 发 现 了 非 分 隔 符 字 符 ; 其 二 ， 
循环 计数 减 为 零 。 标 号 L2 后 面 是 标号 为 L3 的 RET 指令 ， 用 来 结束 整个 过 程 : 


L3s ret 
Str trim ENDP 


9.3.5 ”Str_ucase 过 程 


Str_ucase 过 程 把 一 个 字符 串 全 部 转换 为 大 写字 母 ， 无 返回 值 。 调 用 过 程 时 ， 要 向 其 传 
递 字符 串 的 偏 移 量 : 


INVOKE Str ucase, ADDR myString 


过 程 实现 如 下 : 
a 


; 将 空 字 节 结束 的 字符 囊 转 换 为 大 写字 母 。 
; 返回 : 无 


Str _ucase PROC USES eax esi, 
PString:PTR BYTE 


mov esi,pSstring 
bls 
mov al,l[lesil] 7 取 字 符 
cmp al,0 ;字符 囊 是 否 结束 ? 
je L3 ;是 : 退出 
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cmp al，a' Ee 沁 


jb L2 
cmp al,'z' i 
ja L2 
and BYTE PTR [esi],11011111b  。 ;转换 字符 
L2: inec esi ; 下 一 个 字符 
jmp Ll 
L3: ret 


Str_ ucase ENDP 
(过 程 演示 参见 Ucase.asm 程序 .) 


9.3.6 字符 串 演示 程序 


下 面 的 32 位 程序 ( StringDemo.asm) 演示 了 对 Irivne32 链接 库 中 Str_trim 、Str_ucase 、 
Str_ compare 和 Str_length 过 程 的 调用 : 
; String Library Demo (StringDemo.asm) 


; 该 程序 演示 了 本 书 链接 库 中 的 字符 串 处 理 过 程 。 
INCLUDE Irvine32.inc 
.data 


string_ 1 BYTE "abcde////",0 
string 2 BYTE “ABCDE",0 


msg0 BYTE “stzing_1 in upper case: ",0 

msgl BYTE "string 1 and string 2 are equal",0 
msg2 BYTE "string 1 is less than string 2",0 
msg3 BYTE "string 2 is less than string 1",0 
msg4 BYTE "Length of string 2 is “,0 

msg5 BYTE "string 1 after trimming: ",0 

-code 

main PROC 


call trim string 
call upper case 
call compare strings 
call print length 


exit 
main ENDP 


trim string PROC 
; 从 string_1 删除 尾部 字符 。 
INVOKE Str_trim, ADDR string 1, ‘/' 
mov edx,OFFSET msg5 
call WriteString 
mov edx,OFFSET String_1 
call WriteString 
all Crlf 


ret 
trim string ENDP 


upper case PROC 
; 将 string_1 转换 为 大 写字 母 。 
mov edx,OFFSET msg0 
call Writestring 
INVOKE Str ucase, ADDR string 1 
mov edx,OFFSET string_l 
call Writestring 


call Crlf 
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ret 
upper case ENDP 


compare strings PROC 
; 比较 string 1 和 string 2; 
INVOKE Str compare, ADDR string 1, ADDR string 2 
“IF ZERO? 
mov edx,OFFSET msgl 
“ELSEIF CARRY? 
mov edx,OFFSET msg2 ;string_1 小 于 ……: 
-ELSE 
mov edx,OFFSET msg3 ?string_2 小 于 …… 
.ENDIF 
call WriteString 
Call, “CELE 


ret 
compare strings ENDP 


print length PROC 


? 显示 string 2 的 长 度 。 
mov edx,OFFSET msg4 
call WriteString 
INVOKE Str length, ADDR string 2 
call WriteDec 
eall Crif 


ret 
print length ENDP 
END main 


调用 Str_trim 过 程 从 string_1 删除 尾部 字符 ,调用 Str_ucase 过 程 将 字符 串 转换 为 大 写 
字母 。 


程序 输出 ”String Library Demo 程序 的 输出 如 下 所 示 : 


string 1 after trimming: abcde 
string_1 in upper case: ABCDE 


stringl and string2 are equal 
Length of string 2 is 5 





9.3.7 “Irivne64 库 中 的 字符 串 过 程 


本 节 将 说 明 如 何 将 一 些 比较 重要 的 字符 串 处 理 过 程 从 Irvine32 链接 库 转换 为 64 位 模式 。 
变化 非常 简单 一 删除 堆栈 参数 ， 并 将 所 有 的 32 位 寄存 器 都 替换 为 64 位 寄存 器 。 表 9-5 列 
出 了 这 些 字符 串 过 程 、 过 程 说 明 及 其 输入 输出 。 


表 9-5 |rvine64 链接 库 中 的 字符 串 过 程 
比较 两 个 字符 串 
输入 参数 : RSI 为 源 串 指针 ，RDI 为 目的 串 指针 
返回 值 : 若 源 串 一 目的 串 ， 则 进位 标志 位 CF=1 ; 若 源 串 = 目的 串 ， 则 零 标 志 位 ZF=1; 若 
源 串 > 目的 串 ， 则 CF=0 且 ZF=0 
将 源 串 复制 到 目的 指针 指向 的 位 置 
输入 参数 : RSI 为 源 串 指针 ，RDI 指向 被 复制 串 将 要 存储 的 位 置 
返回 空 字 节 结 束 字 符 串 的 长 度 
输入 参数 : RCX 为 字符 串 指针 
返回 值 : RAX 为 该 字符 串 的 长 度 







Str_ compare 












Str_copy 


Str_length 
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Str_compare 过 程 中 ，RSI 和 RDI 是 输入 参数 的 合理 选择 ， 因 为 字符 串 比 较 循环 会 用 到 
它们 。 使 用 这 两 个 寄存 器 参数 能 在 过 程 开 始 时 避免 将 输入 参数 复制 到 RSI 和 RDI 寄存 器 中 : 


; Str_compare 


; 比较 两 个 字符 串 

; 接收 : RSI 为 源 串 指针 

; RDI 为 目的 串 指针 

; 返回 : 车 字符 串 相 等 ，ZF 置 1 
; 若 源 串 < 目的 串 ，CF 置 1 


Str compare PROC USES rax rdx rsi rdi 


Ll: mov al,[rsil] 
mov dl,[rdi] 


cmp al,0 ;Stringl 结束 ? 

jne L2 ; 

cmp dl1,0 ; 是 : string2 结束 ? 

jne L2 ? 否 

jmp L3 ; 是: 退出 且 ZF=1 
L2; inc rsi ; 指向 下 一 个 字符 

ine radi 

cmp al,dl ; 字符 相等 ? 

je L1 ; 是 : 继续 循环 


7 否 : 退出 并 设置 标志 位 
L3: ret 


Str compare ENDP 


注意 ，PROC 伪 指令 用 USES 关键 字 列 出 了 所 有 需要 在 过 程 开始 时 人 栈 、 在 过 程 时 返回 
出 栈 的 寄存 器 。 


Str_copy 过 程 用 RSI 和 RDI 接收 字符 串 指 针 : 


; Str copy 

; 复制 字符 囊 

; 接收 : RSI 为 源 囊 指针 
; RDI 为 目的 串 指 针 

; 返回 : 无 


Str copy PROC USES rax rcx rsi rdi 


mov rcx,rsi ; 获得 源 串 长 度 
call Str_length ?RAX 返回 长 度 
mov rcx,rax ; 循环 计数 器 
inc rex ; 有 空 字 节 ， 加 1 
cld ; 方向 为 正 向 
rep movsb ; 复制 字符 串 
ret 


Str_copy ENDP 


Str_length 过 程 用 RCX 接收 字符 串 指 针 ， 然 后 循环 扫描 该 字符 串 直到 发 现 空 字 节 。 字 符 


DT 
; 计算 字符 串 长 度 

; 接收 : RCX 指向 字符 串 

; 返回 : RAX 为 字符 串 长 度 


他 人 荐 中 和 数组 291 


Str_Length PROC USES rdi 


mov rdi,rcx ; 获得 指针 
mov eax,0 ; 字符 计数 
Ll13 
cmp BYTE PTR [rdil],0 ; 字符 串 结束 ? 
je I2 ;是 : 退出 
inc radi 7 否 : 指向 下 一 个 字符 
inc rax ; 计数 器 加 1 
jmp Ll1 
L2: ret ;RAX 返回 计数 值 


Str_length ENDP 


一 个 简单 的 测试 程序 下 面 的 测试 程序 调用 了 64 位 的 Str_ length、Str copy 和 Str_ 


compare 过 程 。 虽 然 程 序 中 没有 显示 字符 串 的 语句 ， 但 是 建议 在 Visual Studio 调试 器 中 运 


行 ， 


这 样 就 可 以 查看 内 存 窗口 、 寄 存 器 和 标志 位 。 


; 测试 Irvine64 字符 囊 过 程 (StringLib64Test.asm) 
Str _ compare proto 
Str_length proto 
Str copy proto 
ExitProcess proto 
.data 
source BYTE “AABCDEFGAABCDFG",0 ? 大 小 为 15 
target BYTE 20 dup(0) 
-Code 
main PROC 
mov rcx,offset source 
call Str length ; 用 RAX 返回 长 度 
mov rsi,offset source 
mov rdi,offset target 
call str_ copy 


; 由 于 刚刚 才 复 制 了 字符 串 ， 因 此 它们 应 该 相等 。 


call str_compare ;ZF=1， 字 符 串 相等 
; 修改 目的 串 的 第 一 个 字符 ， 再 比较 两 个 字符 串 


; Compare them again. 
mov target,'B' 
call str compare ;CF=1， 源 串 之 目的 串 
mov ecx,0 


call ExitProcess 
main ENDP 


9.3.8 本 节 回 顾 


1.( 真 / 假 ): 当 发 现 较 长 字符 串 的 空 终 止 符 时 ，Str_compare 过 程 停 止 。 
2.( 真 / 假 ): 32 位 Str_compare 过 程 不 需 使 用 ESI 和 EDI 来 访问 内 存 。 
3.( 真 / 假 ): 32 位 Str_length 过 程 用 SCASB 发 现 字 符 串 末尾 的 空 终止 符 。 
4.( 真 / 假 ): Str_copy 过 程 可 以 防止 将 一 个 字符 串 复 制 到 过 小 的 内 存 区 域 。 


9.4 


二 维 数组 


9.4.1 行列 顺序 


在 汇编 语言 程序 员 看 来 ， 二 维 数 组 是 一 位 数组 的 高 级 抽象 。 高 级 语言 有 两 种 方法 在 内 
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存 中 存放 数组 的 行 和 列 : 行 主 序 和 列 主 序 ， 如 图 9-1 所 示 。 使 用 行 主 序 (最 常用 ) 时 ， 第 一 

行 存放 在 内 存 块 开始 的 位 置 ， 第 一 行 最 后 一 个 元 素 rolzo[30[a0lsoN 

后 面 紧 跟 的 是 第 二 行 的 第 一 个 元 素 。 使 用 列 主 序 时 ， 1 ) 逻辑 顺序 : |60|70|8ol9olAol 

第 一 列 的 元 素 存放 在 内 存 块 开始 的 位 置 ， 第 一 列 最 过 

后 一 个 元 素 后 面 紧 跟 的 是 第 二 列 的 第 一 个 元 素 。 2 ) 行 主 序 
用 汇编 语言 实现 二 维 数组 时 ， 可 以 选择 其 中 的 [10[20lso[ao[solso[70[soloolAosolcofsolEol0 

任意 一 种 顺序 。 本 章 使 用 的 是 行 主 序 。 如 果 是 为 高 a 

级 语言 编写 汇编 子 程序 ， 那 么 应 该 使 用 高 级 语言 

368] ” 档 中 指定 的 顺序 。 ULol6olBol2ol7olcol3olgolpol4ol9ojEolsolAolFo 

x86 指令 集 有 两 种 操作 数 类 型 : 基 址 - 变 址 和 基 图 9-1 行 主 序 和 列 主 序 

址 - 变 址 -位 移 量 ， 这 两 种 类 型 都 适用 于 数组 。 下 面 将 对 它们 进行 研究 并 通过 例子 来 说 明 如 

何 有 效 地 使 用 它们 。 


9.4.2 基 址 - 变 址 操作 数 
基 址 - 变 址 操作 数 将 两 个 寄存 器 〈 称 为 基 址 和 变 址 ) 相 加 ， 生 成 一 个 偏 移 地 址 : 


[base + index] 












其 中 的 方 括号 是 必需 的 。32 位 模式 下 ， 任 一 32 位 通用 寄存 器 都 可 以 用 作 基 址 和 变 址 寄 
存 器 。( 通 常情 况 下 避免 使 用 EBP， 除非 进 行 堆栈 寻 址 。) 下 面 的 例子 是 32 位 模式 中 基 址 和 
变 址 操作 数 的 各 种 组 合 : 


.data 

array WORD 1000h,2000h,3000h 

.code 

mov ebx,OFFSET array 

mov esi,2 

mov ax, [ebx+esi] ; AX = 2000h 


mov edi,OFFSET array 
mov ecx,4 
mov ax, [edi+ecx1] ; AX = 3000h 


mov ebp,OFFSET array 
mov esi,0 
369 mov ax, [ebptesi] ; AX = 1000h 


二 维 数组 ” 按 行 访 问 一 个 二 维 数组 时 ， 行 偏 移 量 放 在 基 址 寄存 器 中 ， 列 偏 移 量 放 在 变 址 
寄存 器 中 。 例 如 ， 下 表 给 出 的 数组 为 3 行 5 列 : 


tableB BYTE 10h， 20h, 30h, 40h， 50h 
Rowsize = ($ - tableB) 
BYTE 60h, 70h， 80h， 90h, 0A0h 
BYTE 0BOh, 0COh, 0DOh, 0E0h, OFOh 


该 表 为 行 主 序 ， 汇 编 器 计算 的 常数 Rowsize 是 表 中 每 行 的 字 节 数 。 如 果 想 用 行列 坐标 定 
位 表 中 的 某 个 表 项 ， 则 假设 坐标 基点 为 0， 那 么 ,位 于 行 1 列 2 的 表 项 为 80h。 将 EBX 设置 
为 该 表 的 偏 移 量 ， 加 上 (Rowsizerow_index)， 计算 出行 偏 移 量 ,将 ESI 设置 为 列 索 引 : 


row index = 1 
column index = 2 


仓 余 中 负数 细 


mov ebx,OFFSET tableB ; 表 偏 移 量 
add ebx,RowSize * row index ; 行 偏 移 量 
mov esi,column index 

mov al,[ebx + esi] ; AL = 80h 
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假设 该 数组 位 置 的 偏 移 量 为 0150h， 则 其 有 效 地 址 表示 为 EBX+ESI， 计 算得 0157h。 图 


9-2 展示 了 如 何 通过 EBX 加 上 ESI 生成 tableB[1, 2] 
字 节 的 偏 移 量 。 如 果 有 效 地 址 指向 该 程序 数据 区 之 [ol2ol3ol4ol5ol6ol7olsol9olAolBolcolpolEoFo 


外 ， 那 么 就 会 产生 一 个 运行 时 错误 。 
1. 计算 数组 行 之 和 


0150 0155 0157 





ebx ebx+esi 


图 9-2 ”用 基 址 - 变 址 操作 数 寻 址 数组 


基于 变 址 的 寻 址 简化 了 二 维 数组 的 很 多 操作 。 比 如 ， 用 户 可 能 想 要 计算 一 个 整数 矩阵 中 
一 行 的 和 。 下 面 的 32 位 calc_row_sum 程序 (参见 RowSum.asm) 就 计算 了 一 个 8 位 整数 矩 


阵 中 被 选中 行 的 和 数 : 


; Calc_row_sum 

; 计算 字 节 矩阵 中 一 行 的 和 数 。 

; 接收 : EBX= 表 偏 移 量 ，EAX= 行 索引 
;ECX= 按 字 节 计 的 行 大 小 。 


; 返回 : ERX 为 和 数 。 
a i 
calc row_ sum PROC USES ebx ecx edx esi 
ml ecx ; 行 索引 x 行 大 小 
add ebx,eax ; 行 
mov eax,0 ; 累加 器 
mov esi,0 ; 列 案 引 
Ll: movzx edx,BYTE PTR[ebx + esi] ; 取 一 个 字 节 
adda eax,edx ; 与 累加 器 相 加 
inc esi ; 行 中 的 下 一 个 字 节 
loop Ll 
ret 


calc row_ sum ENDP 


BYTE PTR 是 必需 的 ， 用 于 声明 MOVZX 指令 中 操作 数 的 类 型 。 


2. 比例 因子 


如 果 是 为 字数 组 编写 代码 ， 则 需要 将 变 址 操作 数 乘 以 比例 因子 2。 下 面 的 例子 定位 行 1 


列 2 的 元 素 值 : 


tablew WORD 10h， 20h, 30h, 40h, 50h 


Rowsizew = ($ - tablew) 


WORD 60h, 70h， 80h, 90h, Oa0h 
WORD 0BOh, 0COh, ODOh, OFE0h, OFOh 


.Code 

row_ index = 1 

column index = 2 

mov ebx,OFFSET tablew 


add ebx,RowSizeW * row index 各 


mov esi,column index 
mov ax, [ebx + esi*TYPE tablew] ; 


本 例 的 比例 因子 (TYPE tableW) 等 于 2。 同 样 ， 如 果 数 组 类 型 为 双 字 ， 则 比例 因子 为 4: 


tableD DWORD 10h, 20h, ...etc. 
-code 
mov eax,[ebx + esi*TYPE tableD] 
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9.4.3 基 址 - 变 址 - 偏 移 量 操作 数 


基 址 - 变 址 - 偏 移 量 操作 数 用 一 个 偏 移 量 、 一 个 基 址 寄存 器 、 一 个 变 址 寄存 器 和 一 个 可 
选 的 比例 因子 来 生成 有 效 地 址 。 格 式 如 下 : 


[base + index + displacement] 
Gisplacement[base + index] 


Displacement ( 偏 移 量 ) 可 以 是 变量 名 或 常量 表达 式 。32 位 模式 下 ， 任 一 32 位 通用 寄存 
器 都 可 以 用 作 基 址 和 变 址 寄存 器 。 基 址 - 变 址 - 偏 移 量 操作 数 非常 适 于 处 理 二 维 数组 。 偏 移 
量 可 以 作为 数组 名 ， 基 址 操作 数 为 行 偏 移 量 ， 变 址 操作 数 为 列 偏 移 量 。 

双 字 数组 示例 ”下面 的 二 维 数组 包含 了 3 行 5 列 的 双 字 : 


tableD DWORD 10h， 20h， 30h, 40h， 50h 
Rowsize = (S$ - tableD) 
DWORD 60h, 70h， 80h， 90h， 0ROh 
DWORD 0B0h，0Ccoh，0D0h，0E0h， 0F0h 


Rowsize 等 于 20 ( 14h)。 假 设 坐 标 基 点 为 0， 那么 位 于 行 1 列 2 的 表 项 为 80h。 为 了 访 
问 到 这 个 表 项 ， 将 EBX 设置 为 行 索引 ，ESI 设置 为 列 索引 : 





mov ebx,Rowsize ; 行 索 引 

mov esi,2 ; 列 索引 

mov eax,tableD[ebx + esi*TYPE tableD] 

设 tableD 开始 于 偏 移 量 0150h 处 ， 图 9-3 0150 0164 016C 
展示 了 EBX 和 ESI 相对 于 该 数组 的 位 置 。 偏 移 1ol2o[a0l4olsoleol7olsoloolAoleolcolpoleoleol 
量 为 十 六 进 制 。 table table[ebx] table[abx+esi*4] 

Rowsize=0014h 

9.4.4 64 位 模式 下 的 基 址 - 变 址 操作 数 图 9-3 ” 基 址 - 变 址 - 偏 移 量 示例 


64 位 模式 中 ， 若 用 寄存 器 索引 操作 数 则 必须 为 64 位 寄存 器 。 基 址 - 变 址 操作 数 和 基 
址 - 变 址 - 偏 移 量 操作 数 都 可 以 使 用 。 
下 面 是 一 段 小 程序 ， 它 用 get_tableVal 过 程 在 64 位 整数 的 二 维 数组 中 定位 一 个 数值 。 
如 果 将 其 与 上 一 节 中 的 32 位 代码 进行 比较 ， 会 发 现 ESI 被 替换 为 RSI，EAX 和 EBX 也 成 
了 RAX 和 了 RBX。 
; 64 位 模式 下 的 二 维 数组 (TwoDimArrays .asm) 
Crlif proto 


WriteInt64 proto 
ExitProcess proto 


.data 
table QWORD 1,2,3,4,5 
RowSize = ($ - table) 


QWORD 6,7,8,9,10 
QWORD 11,12,13,14,15 


.Code 

main PROC 

; 基 址 - 变 址 - 偏 移 量 操作 数 
mov rax,l ; 行 索引 基点 为 0 
mov rsi,4 ; 列 索引 基点 为 0 


call get tableval ;RAX 中 为 返回 值 
call WriteInt64 ; 显示 返回 值 
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Gall Crlf 


mov ecx,0 7 程序 结束 
call ExitProcess 
main ENDP 


; get tableVal 

; 返回 四 字 二 维 数组 中 给 定 行列 值 的 元 素 。 
; 接收: RAX= 行 数 ，RSI= 列 数 

; 返回 : RAX 中 的 数值 

get tableVal PROC USES rbx 


mov rbx,RowSize 


ml rbx ; 乘积 ( 低 )=RAX 
mov rax,table[rax + rsi*xTYPE table] 
ret 

get 七 ableVal ENDP 

end 


9.4.5 ”本 节 回 顾 


1. 32 位 模式 中 ， 哪 些 寄存 器 能 用 于 基 址 - 变 址 操作 数 ? 

2. 假设 一 双 字 二 维 数 组 有 3 个 逻辑 行 和 4 个 逻辑 列 。 若 ESI 用 作 行 索引 ， 当 从 一 行 移 到 下 
一 行 时 ，ESI 应 加 多 少 ? 

3. 32 位 模式 可 以 使 用 EBP 来 寻 址 数组 吗 ? 


9.5 ”整数 数组 的 检索 和 排序 


为 了 找到 更 好 的 方法 对 大 量 数 据 集 进 行 检索 和 排序 ， 计 算 机 科学 家 已 经 花费 了 相当 多 的 
时 间 和 精力 。 与 买 一 台 更 快 的 计算 机 相 比 ， 对 于 具体 应 用 而 言 ， 选 择 最 好 的 算法 被 证 明 更 加 
有 用 。 大 多 数学 生 在 研究 检索 和 排序 时 使 用 的 是 高 级 语言 ， 如 C++ 和 Java。 汇 编 语言 则 在 
算法 研究 上 展示 了 一 种 不 同 的 视角 ， 它 能 让 研究 者 看 到 底层 的 实现 细节 。 

检索 和 排序 提供 了 一 个 机 会 来 尝试 本 章 介绍 的 寻 址 方法 。 尤 其 是 基 址 - 变 址 寻 址 会 被 证 
明 是 有 用 的 ， 因 为 程序 员 可 以 用 一 个 寄存 器 (通常 为 EBX) 作 数 组 的 基 址 ， 而 用 另 一 个 寄存 
器 (通常 为 ESI) 索引 数组 中 的 任何 位 置 。 


9.5.1 冒 泡 排序 


冒 泡 排序 从 位 置 0 和 1 开始 ， 对 比 数组 的 两 个 数值 。 如 果 比 较 结果 为 逆序 ， 就 交换 这 两 
个 数 。 图 9-4 展示 了 对 一 个 整数 数组 进行 一 次 遍历 的 过 程 。 

一 次 冒 泡 过 程 之 后 ， 数 组 仍 没 有 按 序 排列 ， 
但 此 时 最 高 索引 位 置 上 是 最 大 数 。 外 层 循 环 则 开 
始 对 该 数组 再 一 次 遍历 。 经 过 n-1 次 遍历 后 ， 数 
组 就 会 按 序 排列 。 

冒 泡 排序 对 小 型 数组 效果 很 好 ， 但 对 较 大 的 
数组 而 言 ， 它 的 效率 就 十 分 低下 。 计 算 机 科学 家 
在 衡量 算法 的 相对 效率 时 ， 常 常 使 用 一 种 被 称 为 ( 带 阴影 的 数值 进行 了 交换 ) 
“时 间 复 杂 度 ”( big-0) 的 概念 来 描述 随 着 处 理 对 图 9-4 第 一 次 数组 遍历 ( 冒 泡 排 序 ) 
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象 数量 的 增加 ， 平 均 运行 时 间 是 如 何 增加 的 。 冒 泡 排 序 是 0 ( mw) 算法 ， 这 就 意味 着 ， 它 的 


平均 运行 时 间 随 着 数组 元 素 (n) 个 数 的 平方 增加 。 比 如 ， 假 设 1000 个 元 素 排 序 需要 0.1 秒 。 
当 元 素 个 数 增加 10 倍 时 ， 该 数组 排序 所 需要 的 时 间 就 会 增加 10" ( 100 ) 倍 。 下 表 列 出 了 不 
同 数组 大 小 需要 的 排序 时 间 ， 假 设 1000 个 数组 元 素 排序 花费 0.1 秒 : 


数组 大 小 时 间 ( 秒 ) 数组 大 小 时 间 ( 秒 ) 
Lao [LT wm | mm 
io0g 0000 | 00000 C277) 





对 于 一 百 万 个 整数 来 说 ， 冒 泡 排序 谈 不 上 有 效率 ， 因 为 它 完 成 任务 的 时 间 太 长 了 ! 但 是 
对 于 几 百 个 整数 ， 它 的 效率 是 足够 的 。 


伪 代 码 ” 用 类 似 于 汇编 语言 的 伪 代 码 为 冒 泡 排序 编写 的 简化 代码 是 有 用 的 。 代 码 用 N 
表示 数组 大 小 ，cx1 表示 外 循环 计数 器 ，cx2 表示 内 循环 计数 器 : 


cx =N-1 
while( cx1 > 0 ) 
{ 
esi = addr (array) 
Cx2 = cx1 
while( cx2 > 0 ) 
{ 
if({ array[esi] > array[esi+4] ) 
exchange( arrayl[esi], arrayl[esi+4] ) 
add esi,4 
dec cx2 
2 
Gec cx1 
有 


如 保存 和 恢复 外 循环 计数 器 等 的 机 械 问题 被 刻意 忽略 了 。 注 意 内 循环 计数 (cx2 ) 是 基 
于 外 循环 计数 (cx1 ) 当前 值 的 ， 每 次 遍历 数组 时 它 都 依次 递减 。 

汇编 语言 ”根据 伪 代 码 能 够 很 容易 生成 与 之 对 应 的 汇编 程序 ， 并 将 它 表 示 为 带 参数 和 局 
部 变量 的 过 程 : 


8 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
’” 


; BubbleSort 


; 使 用 冒 泡 算法 ， 将 一 个 32 位 有 符号 整数 数组 按 升 序 进 行 排列 。 
; 接收 : 数组 指针 ， 数 组 大 小 


7 返回 : 无 
BubbleSort PROC USES eax ecx esi, 
pArray:PTR DWORD, ; 数组 指针 
Count :DWORD ; 数组 大 小 
mov ecx,Count 
dec ecx ; 计数 值 减 1 
L1: push ecx ; 保存 外 循环 计数 值 
mov esi,pArray ; 指向 第 一 个 数值 
L2: mov eax,[esil] ; 取 数 组 元 素 值 
cmp [esi+4],eax ; 比较 两 个 数值 
jg L3 ; 如 果 [ESI]<=[ESI+4] ， 不 交换 
xchg eax,[esi+4] ; 交换 两 数 


mov [esil],eax 


L3:; add esi,4 ;两 个 指针 都 向 前 移动 一 个 元 素 
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loop L2 ; 内 循环 


pop ecx ; 恢复 外 循环 计数 值 
loop Ll ; 车 计数 值 不 等 于 0, 则 继续 外 循环 
L4; ret 


BubbleSort ENDP 


9.5.2 ”对 半 查 找 


数组 查找 是 日 常 编程 中 最 常见 的 一 类 操作 。 对 小 型 数组 ( 1000 个 元 素 或 更 少 ) 而 言 ， 顺 
序 查找 ( sequential search) 是 很 容易 的 ， 从 数组 开始 的 位 置 顺序 检查 每 一 个 元 素 ， 直 到 发 现 
匹配 的 元 素 为止 。 对 任意 ) 个 元 素 的 数组 ， 顺 序 查找 平均 需要 比较 n/2 次 。 如 果 查 找 的 是 小 
型 数组 ， 则 执行 时 间 也 很 少 。 但 是 ， 如 果 查 找 的 数组 包含 一 百 万 个 元 素 就 需要 相当 多 的 处 理 
时 间 了 。 

对 半 查 找 (binary search) 算法 用 于 从 大 型 数组 中 查找 一 个 数值 是 非常 有 效 的 。 但 是 它 
有 一 个 重要 的 前 提 : 数组 必须 是 按 升序 或 降序 排列 。 下 面 的 算法 假设 数组 元 素 是 升序 : 

开始 查找 前 ， 请 求 用 户 输入 一 个 整数 ， 将 其 命名 为 searchVal。 

1 ) 被 查找 数组 的 范围 用 下 标 first 和 last 来 表示 。 如 果 first > last， 则 退出 查找 ， 也 就 
是 说 没有 找到 匹配 项 。 

2 ) 计算 位 于 数组 first 和 last 下 标 之 间 的 中 点 。 

3 ) 将 searchVal 与 数组 中 点 进行 比较 : 

e 如 果 数 值 相 等 ， 将 中 点 送 入 EAX， 并 从 过 程 返回 。 该 返回 值 表示 在 数组 中 发 现 了 匹 

配 值 。 

e 否则 ， 如 果 searchVal 大 于 中 点 值 ， 则 将 first 重新 设置 为 中 点 后 一 位 元 素 的 位 置 。 

e@ 或 者 ， 如 果 searchVal 小 于 中 点 值 ， 则 将 last 重新 设置 为 中 点 前 一 位 元 素 的 位 置 。 

4 ) 返回 步骤 1 )。 

对 半 查 找 效 率 高 的 原因 是 它 采 用 了 分 而 治之 的 策略 。 每 次 循环 迭代 中 ， 数 值 范围 都 被 对 
半分 为 成 两 部 分 。 通 常 它 被 描述 为 O (log n) 算 。” 表 9-6 顺序 查找 与 对 半 查 找 的 最 大 比较 次 数 
法 ， 即 ， 当 数组 元 素 增加 倍 时 ,平均 查找 时 
间 仅 增加 logzn 倍 。 为 了 帮助 了 解 对 半 查 找 效 率 | 
有 多 高 ， 表 9-6 列 出 了 数组 大 小 相同 时 ， 顺 序 
查找 和 对 半 查 找 需 要 执行 的 最 大 比较 次 数 。 表 
中 的 数据 代表 的 是 最 坏 的 情况 一 “在 实际 应 用 1048576 
中 ， 经 过 更 少 次 的 比较 就 可 能 找到 匹配 数值 。 。 一 4294967296 

下 面 是 用 C++ 语言 实现 的 对 半 查 找 功 能 ， 用 于 有 符号 整数 数组 : 


int BinSearch( int values[], const int searchval, int count ) 
{ 

int first = 0; 

int last = count -~ 1; 
















while( first <= last ) 


int mid = (last + first) / 2; 
if( values[mid] < searchVal ) 
first = mid + 1; 
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else if( values[mid] > searchVal ) 


last = mid - 1; 


else 
return mid; /1 成 功 
} 
return -1; // 未 找到 


} 


该 C++ 代码 示例 的 汇编 语言 程序 清单 如 下 所 示 : 


; BinarySearch 


; 在 一 个 有 符号 整数 数组 中 查找 某 个 数值 。 


? 接收 : 数组 指针 、 数 组 大 小 、 给 定 查找 数值 


; 返回 : 车 发 现 匹配 项 ， 则 EAX= 该 匹配 元 素 在 数组 中 的 位 置 ; 否则 ，EAX=-1。 


BinarySearch PROC USES ebx edx esi edi, 
pArray:PTR DWORD, ; 数组 指针 
Count :DWORD, ; 数组 大 小 
searchVal :DWORD ; 给 定 查找 数值 
LOCAL first:DWORD, ;first 的 位 置 
last:DWORD, ;last 的 位 置 
mid:DWORD ; 中 点 
mov first,0 了 二 
mov eax,Count ; last = (count - 1) 


dec eax 
mov last,eax 
mov edi,searchVval 


; EDI = SearchVal 


mov ebx,pArray ; EBX 为 数组 指针 
L1: ; 当 first <=last 时 

mov eax,first 

cmp eax, last 

jg 15 ; 退出 查找 
BE 大 2 

mov eax,1last 

add eax,first 

shr eax,l 

mov mid,eax 
; EDX = values[mid] 

mov esi,mid 

shl esi,2 ; 将 mid 值 乘 4 

mov edx,[ebxt+esi] ; EDX = values[mid] 
;车 EDX < searchVal (EDI) 

cmp edx,edi 

jge LL2 
? first = mid + 1 

mov eax,mid 

inc eax 

mov first,eax 

jmp L4 
; 否则 ,车 EDX > searchVal (EDI) 
L2: cmp edx,edi 

jle 13 ; 可 选项 
last = mid - 1 

mov eax,mid 

dec eax 

mov last,eax 

jmp L4 
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? 否则 返回 mid 

L3: mov eax,mid ; 发 现 数值 
jmp L9 ; 返回 mid 

L4: jmp 1 ; 继续 循环 

L5: mov eax,-l ; 查找 失败 

L9: ret 

BinarySearch ENDP 

测试 程序 


为 了 演示 本 章 介绍 的 冒 泡 排序 和 对 半 查 找 功能 ， 现 在 编写 一 个 简单 的 程序 顺序 执行 如 下 


e 用 随机 整数 填充 数组 

e 显示 该 数组 

e 用 冒 泡 法 对 数组 排序 

e 再 次 显示 数组 

e 请 求 用 户 输入 一 个 整数 

e (在 数组 中 ) 对 半 查 找 用 户 输入 的 整数 

e 显示 对 半 查 找 的 结果 

每 个 过 程 都 放 在 独立 的 源 文件 中 ， 使 得 定位 和 编辑 源 代码 更 加 方便 。 表 9-7 列 出 了 每 个 
模块 及 其 内 容 。 大 多 数 编写 专业 的 程序 都 会 分 为 独立 的 代码 模块 。 

表 9-7 置 泡 排序 / 对 半 查 找 程序 中 的 模块 


模块 内 容 
主 模块 : 包含 main，ShowResult， 和 AskForSearchVal 过 程 。 包 含 程序 人 口 ， 并 管理 整个 任 
BinarySearchTest.asm 务 序列 
BubbleSort.asm BubbleSort 过 程 : 执行 32 位 有 符号 整数 数组 的 冒 泡 排序 
BinarySearch.asm BinarySearch 过 程 : 执行 32 位 有 符号 整数 数组 的 对 半 查 找 
FillArray.asm FillArray 过 程 : 用 一 组 随机 数 填充 32 位 有 符号 整数 数组 
PrintArray.asm PrintArray 过 程 : 将 32 位 有 符号 整数 数组 写 到 标准 输出 


所 有 模块 中 的 过 程 ， 除 了 BinarySearchTest.asm 外 ， 都 按照 这 种 方式 来 编写 ， 这 易于 在 
其 他 程序 中 使 用 它们 而 不 用 加 以 任何 修改 。 这 种 做 法 相当 可 取 ， 因 为 将 来 在 重用 已 有 代码 时 
可 以 节约 时 间 。Irvine32 链接 库 就 采用 了 同样 的 方法 。 下 面 的 头 文件 ( BinarySearch.inc) 包 
含 了 被 main 模块 调用 过 程 的 原型 : 


;BinarySearch.inc 一 冒 泡 排序 / 对 半 查 找 程序 中 使 用 的 过 程 原型 。 
7 在 32 位 有 符号 整数 数组 中 查找 一 个 数 。 
BinarySearch PROTO, 


pArray:PTR DWORD, ;? 指向 数组 
Count : DWORD, ; 数组 大 小 
searchVal :DWORD ; 查找 数值 
; 用 32 位 有 符号 随机 整数 填充 数组 
PRrray:PTR DWORD, ; 指向 数组 
Count : DWORD, ; 元 素 个 数 
LowerRange:SDWORD, ; 随机 数 的 下 限 
UpperRange:SDWORD ; 随机 数 的 上 痕 


; 将 32 位 有 符号 整数 数组 写 到 标准 输出 


PRArray:PTR DWORD, 
Count : DWORD 
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;将 数组 按 升 序 排列 
pArray:PTR DWORD, 
Count : DWORD 


main 模块 ，BinarySearchTest.asm 的 代码 清单 如 下 : 


; 冒 泡 排 序 和 对 半 查 找 BinarySearchTest .asm 


; 对 一 个 有 符号 整数 数组 进行 冒 泡 排序 ， 并 执行 对 半 查 找 。 


;main 模块 ， 调 用 BainarySearch, BubbleSort, FillArray 和 PrintArray 


INCLUDE Irvine32.inc 


INCLUDE BinarySearch.inc ; 过 程 原型 
LOWVAL = -5000 ; 最 小 值 
HIGHVAL = +5000 ; 最 大 值 
ARRAY SIZE = 50 ; 数组 大 小 
.data 

array DWORD ARRAY SIZE DUP(?) 

.Code 

main PROC 


call Randomize 


; 用 有 符号 随机 整数 填充 数组 


INVOKE FillArray, ADDR array, ARRAY SIZE, LOWVAL, HIGHVAL 


;显示 数组 
INVOKE PrintArray, ADDR array, ARRAY SIZE 
call WaitMsg 


; 执行 冒 泡 排序 并 再 次 显示 数组 
INVOKE BubbleSort, ADDR array, ARRAY SIZE 
INVOKE PrintArray, ADDR array, ARRAY SIZE 


; 实现 对 半 查 找 
call AskForSea chVal ; 用 EAX 返回 
INVOKE BinarySearch, 
ADDR array, ARRAY SIZE, eax 
call ShowResults 
exit 
main ENDP 


AskForSearchVal PROC 


; 请求 用 户 输入 一 个 有 符号 整数 。 
; 接收 : 无 
; 返回 : EAX= 用 户 输入 的 数值 


.data 
prompt BYTE "Enter a signed decimal integer " 
BYTE “in the range of -5000 to +5000 " 
BYTE "to find in the array: "1,0 
-Code 
call Crlf 
mov edx,OFFSET prompt 
call WriteString 
call ReadInt 
ret 
AskForSearchVal ENDP 


ShowResults PROC 
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; 显示 对 半 查 找 的 结果 值 。 
; 接收 : EAX= 被 显示 数 的 位 置 


data 
msgl BYTE "The value was not found.",0 
msg2 BYTE “The value was found at position ",0 
.Code 
"IF eax == - 
mov edx,OFFSET msgl 
call WriteString 
.ELSE 
mov edx,OFFSET msg2 
call WriteString 
call WriteDec [380 
» ENDIF 
Call Crif 
call Crlf 
ret 
ShowResults ENDP 
END main 


PrintArray 包含 PrintArray 过 程 的 模块 清单 如 下 : 


;PrintArray 过 程 (PrintArray.asm) 
INCLUDE Irvine32.inc 


PrintArray PROC USES eax ecx edx esi, 
pArray:PTR DWORD, ; pointer to array 
Count :DWORD ; number of elements 


; 将 32 位 有 符号 十 进 制 整数 数组 写 到 标准 输出 ， 数 值 用 逗号 隔 开 
; 接收 : 数组 指针 、 数 组 大 小 
; 返回 ; 无 
.data 
corimna BYTE “, ";0 
.Code 
mov esi,pArray 
mov ecx,Count 


cld ; 方向 为 正 向 
L1:. lodsd ;加载 [ESI] 到 EAX 
call WriteInt ; 发 送 到 输出 
mov edx,OFFSET comma 
call Writestring /显示 逗号 
loop Ll 
Call Cr1lf 
ret 
PrintArray ENDP 
END 
FillArray 包含 FillArray 过 程 的 模块 清单 如 下 : 
?FillArray 过 程 (FillArray .asm) 


INCLUDE Irvine32.inc 
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FillArray PROC USES eax edi ecx edx, 


pArray:PTR DWORD, ; 数组 指针 
Count :DWORD, ; 元素 个 数 
LowerRange:SDWORD, ; 范围 下 限 
UpperRange: SDWORD ; 范围 上 限 


7 


7 用 LowerRange 到 (UpperRange-1l1 之 间 的 32 位 随机 有 符号 整数 序列 填充 数组 。) 


7 返回 : 无 

人 
mov edi,pArray ?EDI 为 数组 指针 
mov ecx,Count ; 循环 计数 器 
mov edx,UpperRange 
sub edx,LowerRange ;EDX= 绝对 范围 0. .n 
cld ; 方向 标志 位 清 零 

L1: mov eax,edx ; 取 绝 对 范围 
call RandomRange 
add eax,LowerRange ; 偏 移 处 理 结 果 
stosd ; 将 EAX 保存 到 [edi] 
loop Ll 
ret 

FillArray ENDP 

END 

9.5.3 ”本 节 回 顾 


1. 假设 一 数组 已 经 是 顺序 排列 ， 则 在 9.5.1 节 的 BubbleSort 过 程 中 ， 其 外 循环 需要 执行 多 
少 次 ? 

2. 在 BubbleSort 过 程 中 ， 第 一 次 遍历 数组 时 内 循环 需 执 行 多 少 次 ? 

3. 在 BubbleSort 过 程 中 ， 内 循环 执行 的 次 数 是 否 总 相同 ? 

4. 若 (通过 测试 ) 发 现 一 个 有 500 个 整数 的 数组 排序 需要 0.5 秒 ， 那 么 当 数组 含有 5000 个 整 
数 时 ， 冒 泡 排 序 需要 多 少 秒 ? 


9.6 Java 字 节 码 : 字符 串 处 理 (可 选 主题 ) 


第 8 章 介 绍 了 Java 字 节 码 ， 并 说 明了 怎样 将 java.class 文件 反 汇 编 为 可 读 的 字 节 码 格 
式 。 本 节 将 展示 Java 如 何 处 理 字 符 串 ， 以 及 处 理 字符 串 的 方法 。 
示例 : 寻 址 子 串 
下 面 的 Java 代码 定义 了 一 个 字符 串 变 量 ， 其 中 包含 了 一 个 雇员 ID 和 该 雇员 的 姓氏 。 然 
调用 substring 方法 将 账号 送 入 第 二 个 字符 串 变 量 : 


String empInfo = "10034Smith"; 
String id = empInfo.substring(0,5); 


Tm 


对 该 Java 代码 反 汇 编 ， 其 字 节 码 显示 如 下 : 


: ldc: #32? // 字符 串 10034Smith 
: astore _0 


: aload 0 

: iconst 0 

: iconst 5 

: invokevirtual #34; // Method java/lang/String.substring 
: astore_l 


现在 分 步 研究 这 段 代码 ， 并 加 上 自己 的 注释 。lde 指令 把 一 个 对 字符 串 文 本 的 引用 从 常 
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量 池 加 载 到 操作 数 栈 。 接 着 ，astore_0 指令 从 运行 时 堆栈 弹出 该 字符 串 引 用 ， 并 把 它 保存 到 
局 部 变量 empInfo 中 ， 其 在 局 部 变量 区 域 中 的 索引 为 0: 


0: ldc #32; // 加 载 文 本 字符 捉 : 10034Smith 

2: astore 0 // 保存 到 empInfo( 索引 0) 

接 下 来 ，aload_0 指令 把 对 empInfo 的 引用 压 人 操作 数 栈 : 
3: aload 0 // 加 载 empInfo 到 堆栈 


然后 ， 在 调用 substring 方法 之 前 ， 它 的 两 个 参数 (0 和 5 ) 必须 压 人 操作 数 栈 。 该 操作 
由 指令 iconst 0 和 iconst 5 完成 : 
4: iconst_0 


5s iconst 5 


invokevirtual 指令 调用 substring 方法 ， 它 的 引用 ID 号 为 34: 


6: invokevirtual #34; // Method java/lang/String.substring 


substring 方法 将 参数 弹出 堆栈 ， 创 建新 字符 串 ， 并 将 该 字符 串 的 引用 压 人 操作 数 栈 。 其 
后 的 astore_1 指令 把 这 个 字符 串 保 存 到 局 部 变量 区 域内 索引 1 的 位 置 ， 也 就 是 变量 id 所 在 
的 位 置 : 


9: astore 1 


9.7 本章 小 结 


为 了 对 内 存 进行 高 速 访问 ， 对 字符 串 原 语 指令 进行 了 优化 ， 这 些 指令 包括 
MOVS: 传送 字符 串 数 据 
CMPS: 比较 字符 串 
SCAS: 扫描 字符 串 
STOS: 存储 字符 串 数据 

e。 LODS: 将 字符 串 加 载 到 累加 器 

在 对 字 节 、 字 或 双 字 进行 操作 时 ， 每 个 字符 串 原 语 指令 都 分 别 加 上 后 级 B、W 或 D。 

前 级 REP 利用 变 址 寄存 器 的 自动 增 减 重复 执行 字符 串 原 语 指令 。 例 如 ，REPNE 与 
SCASB 组 合 时 ， 它 就 一 直 扫 描 内 存 字 节 单 元 ， 直 到 由 EDI 指向 的 内 存 数值 等 于 AL 寄存 
器 中 的 值 。 每 次 执行 字符 串 原始 指令 过 程 中 ,方向 标志 位 DF 决定 变 址 寄存 器 是 增加 还 是 
减少 。 

字符 串 和 数组 实际 上 是 一 样 的 。 以 往 ， 一 个 字符 串 就 是 由 单字 节 ASCII 码 数组 构成 的 ， 
但 是 现在 字符 串 也 可 以 包含 16 位 Unicode 字符 。 字 符 串 与 数组 之 间 唯 一 的 重要 区 别 就 是 : 
字符 串通 常用 一 个 空 字 节 (包含 0 ) 表示 结束 。 

数组 操作 是 计算 密集 型 的 ， 因 为 一 般 它 会 涉及 循环 算法 。 大 多 数 程序 80% ~ 90% 的 运 
行 时间 都 用 来 执行 其 代码 的 一 小 部 分 。 因 此 ， 通 过 减少 循环 中 指令 的 条 数 和 复杂 度 就 可 以 提 
高 软件 的 速度 。 由 于 汇编 语言 能 控制 每 个 细节 ， 所 以 它 是 极 好 的 代码 优化 工具 。 比 如 ,通过 
用 寄存 器 来 代替 内 存 变量 ， 就 能 够 优化 代码 块 。 或 者 可 以 使 用 本 章 介 绍 的 字符 串 处 理 指 令 ， 
而 不 是 用 MOV 和 CMP 指令 。 
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本 章 介 绍 了 几 个 有 用 的 字符 串 处 理 过 程 : Str_copy 过 程 将 一 个 字符 串 复 制 到 另 一 个 字符 
串 。Str_ length 过 程 返回 字符 串 的 长 度 。Str_ compare 比较 两 个 字符 串 。Str_trim 从 一 个 字符 
串 尾 部 删除 指定 字符 。Str_ucase 将 一 个 字符 串 转 换 为 大 写字 母 。 

基 址 - 变 址 操作 数 有 助 于 处 理 二 维 数 组 ( 表 )。 可 以 将 基 址 寄存 器 设置 为 表 的 行 地 址 ， 
而 将 变 址 寄存 器 设置 为 被 选择 行 的 列 偏 移 量 。32 位 模式 中 ， 所 有 32 位 通用 寄存 器 都 可 以 被 
用 作 基 址 和 变 址 寄存 器 。 基 址 - 变 址 - 偏 移 量 操作 数 与 基 址 - 变 址 操作 数 类 似 ， 不 同 之 处 在 
于 ， 前 者 还 包含 数组 名 : 

[ebx + esi] ; 基 址 - 变 址 

array[ebx + esi] ; 基 址 - 变 址 - 偏 移 量 

本 章 还 用 汇编 语言 实现 了 冒 泡 排序 和 对 半 查 找 。 冒 泡 排 序 把 一 个 数组 中 的 元 素 按照 升序 
或 降序 排列 。 对 几 百 个 元 素 的 数组 来 说 ， 它 有 很 好 的 效率 ， 但 是 对 元 素 个 数 更 多 的 数组 则 效 
率 很 低 。 对 半 查 找 在 顺序 排列 的 数组 中 实现 单个 数值 的 高 速 搜 索 。 它 易于 用 汇编 语言 实现 。 


9.8 ”关键 术语 和 指令 


base-index operands ( 基 址 - 变 址 操作 数 ) MOVSB 、MOVSD 、MOVSW 

base-index-displacement operands( 基 址 - 变 址 - REP、REPE、REPNE、REPNZ、REPZ 
偏 移 量 操作 数 ) repeat prefix (重复 前 缀 ) 

CMPSB、 CMPSW、 CMPSD row-major order ( 行 主 序 ) 

column-major order ( 列 主 序 ) SCASB 、SCASD 、SCASW 

Direction flag (方向 标志 位 ) STOSB 、STOSW 、STOSD 

Java bytecodes (Java 字 节 码 ) string primitives (字符 串 原 语 ) 


LODSB, LODSW LODSD 


9.9 复习 题 和 练习 


9.9.1 简 答题 


1. 执行 字符 串 原 语 时 ， 怎 样 设置 方向 标志 位 CF 会 使 变 址 寄存 器 反 向 遍历 内 存 区 ? 

2. 当 重 复 前 级 与 STOSW 一 起 使 用 时 ， 变 址 寄存 器 增加 或 减少 的 值 是 多 少 ? 

3. 何 种 使 用 方式 将 导致 CMPS 指令 意义 不 明 ? 

4. 若 方向 标志 位 清 零 ， 且 SCASB 发 现 了 匹配 的 字符 ， 则 此 时 EDI 指向 哪里 ? 

5. 若 想 通过 扫描 发 现 第 一 次 出 现在 数组 中 的 特定 字符 ,那么 最 好 使 用 哪 种 重复 前 缀 ? 

6. 9.3 节 Str_trim 过 程 中 的 方向 标志 位 应 如 何 设置 ? 

7. 为 什么 9.3 节 的 Str_trim 过 程 要 使 用 JNE 指令 ? 

8. 如 果 目 标 字 符 串 包含 了 一 个 数字 ， 则 9.3 节 的 Str_ucase 过 程 将 出 现 什么 情况 ? 

9. 如 果 9.3 节 的 Str_length 过 程 使 用 了 SCASB， 那 么 最 合适 的 重复 前 缀 是 哪个 ? 

10. 如 果 9.3 节 的 Str_length 过 程 使 用 了 SCASB， 那 么 它 将 如 何 计 算 并 返回 字符 串 长 度 ? 
11. 若 数组 包含 1024 个 元 素 . 则 对 半 查 找 最 多 需要 比较 多 少 次 ? 

12. 在 9.5 节 对 半 查 找 示例 中 ,其 FillArray 过 程 为 什么 必须 用 CLD 指令 清除 方向 标志 位 ? 
13. 在 9.5 节 的 BinarySearch 过 程 中 ， 为 什么 能 在 不 影响 结果 的 情况 下 删除 标号 L2 的 语句 ? 
14. 在 9.5 节 的 BinarySearch 过 程 中 ， 什 么 情况 下 有 可 能 删除 标号 L4 的 语句 ? 
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9.9.2 ”算法 基础 


1. 举例 说 明 32 位 模式 下 的 基 址 - 变 址 操作 数 。 
2. 举例 说 明 32 位 模式 下 的 基 址 - 变 址 - 偏 移 量 操作 数 。 
3. 假设 一 双 字 二 维 数组 有 3 个 逻辑 行 和 4 个 逻辑 列 。 编 写 表 达 式 ， 用 ESI 和 EDI 指向 第 2 行 第 3 列 。 
( 行 、 列 都 从 0 开始 编号 。) 
4. 编写 指令 ， 用 CMPSW 比较 两 个 16 位 的 数组 sourcew 和 targetw。 
5. 编写 指令 ， 用 SCASW 在 数组 wordArray 中 扫描 16 位 的 数值 0100h， 并 将 匹配 元 素 的 偏 移 量 复制 到 
EAX 寄存 器 。 
6. 编写 指令 序列 ， 用 Str_compare 过 程 判断 两 个 输入 字符 串 中 的 较 大 者 ， 并 将 其 输出 到 控制 台 窗口 。 
7. 说 明 如 何 调用 Str_trim 过 程 ， 并 从 一 个 字符 串 中 删除 所 有 的 尾部 字符 “@”。 
8. 说 明 如 何 修 改 Irvine32 链接 库 的 Str_ucase 过 程 ， 使 之 将 所 有 字符 转换 为 小 写 。 
9. 编写 64 位 的 Str_trim 过 程 。 
10. 举例 说 明 64 位 模式 下 的 基 址 - 变 址 操作 数 。 [385] 
11. 假设 有 一 32 位 的 二 维 整数 数组 myArray， 若 EBX 为 其 行 索引 ，EDI 为 其 列 索引 ， 编 写 一 条 语句 将 
指定 数组 元 素 的 值 送 入 EAX 寄存 器 。 
12. 假设 有 一 64 位 的 二 维 整数 数组 myArray， 若 RBX 为 其 行 索引 ，RDI 为 其 列 索 引 ， 编 写 一 条 语句 将 
指定 数组 元 素 的 值 送 和 RAX 寄存 器 。 


9.10 ”编程 练习 


下 面 的 练习 可 以 用 32 位 模式 或 64 位 模式 完成 。 所 有 字符 串 处 理 过 程 都 假设 使 用 的 是 空 字 符 结束 
的 字符 串 。 即 使 没有 明确 的 要 求 ， 每 道 练 习 都 需 编 写 简单 的 驱动 程序 来 测试 所 实现 的 新 过 程 。 
* 1. 改进 Str_copy 过 程 
本 章 给 出 的 Str_copy 过 程 没有 限制 被 复制 字符 的 数量 。 编 写 新 过 程 (名 为 Str_copyN) 再 接收 
一 个 输入 参数 ， 表 示 被 复制 字符 数 的 最 大 值 。 
**2.tr_ concat 过 程 
编写 过 程 Str_concat 将 源 串 连接 到 目的 串 的 末尾 。 目 的 串 必 须 有 足够 的 空间 来 容纳 新 字符 。 传 
递 源 串 和 目的 串 的 指针 。 示 例 调用 如 下 所 示 : 


data 

“targetSstr BYTE "ABCDE",10 DUP(0) 

sourceStr BYTE "FGH",0 

.Code 

INVOKE Str concat, ADDR targetstr, ADDR sourceStr 





* 3. Str_remove 过 程 
编写 过 程 Str_remove 从 字符 串 中 删除 个 字符 。 需 传递 参数 为 : 被 删除 字符 在 串 中 的 位 置 指 
针 ， 以 及 定义 删除 字符 数量 的 整数 。 例 如 ， 下 面 的 代码 展示 了 如 何 从 target 中 删除 “xxxx”: 
.data 
target BYTE "abcxxxxdefghijklmop",0 
.code 
INVOKE Str remove, ADDR [target+3], 4 
***4. Str_find 过 程 
编写 过 程 Str_find 在 目的 串 中 查找 第 一 次 出 现 的 源 串 ， 并 返回 其 位 置 。 输 入 参数 为 源 串 指针 和 
目的 串 指 针 。 如 果 查 找 成 功 ， 过 程 将 零 标 志 位 ZF 置 1， 用 EAX 指向 目的 串 的 匹配 位 置 。 否 则 ，ZF 
清 零 ，EAX 无 定义 。 例 如 ， 下 面 的 代码 查找 “ABC”， 并 用 EAX 返回 “A ”在 目的 串 中 的 位 置 : 386 














306 务 9 章 


三 页 5. 


丰 友 6. 


妈 宙 二 7 


8: 


-data 

target BYTE "123ABC342432",0 

source BYTE “ABC",0 

pos DWORD ? 

:Code 

INVOKE Str find, ADDR source, ADDR target 
jnz notFound 


mov pos,eax ; 保存 位 置 值 
Str_nextWord 过 程 

编写 过 程 Str_nextWord 扫描 字符 串 ， 查 找 第 一 次 出 现 的 指定 分 隔 符 ， 并 将 其 替换 为 空 字 节 。 
输入 参数 有 两 个 : 字符 串 指 针 和 分 隔 符 。 调 用 之 后 ， 如 果 发 现 分 隔 符 ， 零 标志 位 ZF 置 1，EAX 为 


分 隔 符 下 一 个 字符 的 偏 移 量 。 否 则 ，ZF 清 零 ，EAX 无 定义 。 下 面 的 示例 代码 传递 了 target 的 指针 
和 分 隔 符 “，， 


.data 

target BYTE "Johnson,Calvin",0 

-Code 

INVOKE Str nextWord, ADDR target, 空 字 节 


jnz notFound 


ER 
如 图 9-5 所 示 ， 调 用 Str_nextWord 后 ，EAX | 


指向 了 被 发 现 (并 替换 ) 的 “,” 后 面 的 那个 字符 。 EAX 
构建 频率 表 图 9-5 Str_nextWord 示例 

编写 过 程 Get_frequencies 构建 一 个 字符 频率 表 。 需 向 过 程 输入 字符 串 指 针 ， 以 及 一 个 数组 指 
针 ， 该 数组 包含 256 个 双 字 ， 并 已 初始 化 为 全 0。 每 个 数组 位 置 都 由 其 对 应 字符 的 ASCII 码 进行 索 
引 。 过 程 返回 时 ， 数 组 中 的 每 一 项 包含 的 是 对 应 字符 在 串 中 出 现 的 次 数 。 例 如 ， 


.data 

target BYTE "AAEBDCFBBC",0 

freqTable DWORD 256 DUP(0) 

.code 

INVOKE Get frequencies, ADDR target, ADDR freqTable 


图 9-6 展示 了 一 个 字符 串 和 频率 表 的 表 项 41 ”目标 字符 申 [A[ATE[BID[CTF[BTBTCT0] 
(十 六 进 制 ) 到 4B。 位 置 41 包 含 数值 2， 原 因 是 ASCII 码 41 4145 42 44 43 46 42 42 43 0 


字母 A (ASCII 码 为 41h) 在 字符 串 中 出 现 了 两 次 。 频率 表 
其 他 字符 也 进行 相同 的 计数 。 频 率 表 常 用 于 数据 索引 41 42 43 44 45 46 47 48 49 4A4B 等 等 
压缩 和 其 他 涉及 字符 处 理 的 应 用 。 例 如 ， 哈 夫 曼 图 9-6 字符 频率 表示 例 
(Huffman) 编码 算法 中 ， 与 较 不 常用 的 字符 相 比 ， 最 常 出 现 字符 的 保存 位 数 更 少 。 
厄 拉 多 塞 过 滤 算法 

厄 拉 多 塞 (Eratosthenes) 过 滤 算 法 ， 由 同名 的 希腊 数学 家 发 明 ， 提 供 了 在 给 定 范 围 内 快速 查找 
所 有 质数 的 方法 。 该 算法 创建 一 个 字 节 数组 ， 并 按 如 下 方式 在 “被 标记 ”位 置 上 插入 1: 从 位 置 2 2 
是 质数 ) 开始 ， 则 数组 中 所 有 2 的 倍数 的 位 置 都 插入 1。 接 着 ， 对 下 一 个 质数 3， 用 同样 的 方法 处 
理 3 的 倍数 。 查 找 3 之 后 的 质数 ， 该 数 为 5， 再 对 所 有 5 的 倍数 的 位 置 进行 标记 。 持 续 这 种 操作 直 
到 找 出 质数 的 全 部 倍数 。 那 么 ， 剩 下 数组 中 没有 被 标记 的 位 置 就 表示 其 数 为 质数 。 编 写 程 序 ， 创 建 
一 个 含有 65 000 个 元 素 的 数组 ， 并 显示 2 到 65 000 之 间 的 所 有 质数 。 要 求 ， 在 未 初始 化 数据 段 中 
声明 该 数组 (参见 3.4.1 节 )， 且 使 用 STOSB 把 0 填充 到 数组 中 。 
冒 泡 排 序 

向 9.5.1 节 的 BubbleSort 过 程 添加 一 个 变量 ， 进 行内 循环 时 ， 只 要 有 一 对 数值 交换 就 将 其 置 1。 
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若 在 某 次 遍历 过 程 中 发 现 没 有 数值 交换 ， 就 在 过 程 正 常 结束 之 前 ， 利 用 该 变量 提前 退出 。( 该 变量 
通常 被 称 为 交换 标志 (exchange flag)。) 
ix* 9. 对 半 查 找 
重新 编写 本 章 给 出 的 对 半 查 找 过 程 ， 用 寄存 器 来 表示 mid、first 和 last。 添 加 注释 说 明 寄存 器 
的 用 法 。 
*** 10. 字母 矩阵 
编写 过 程 生成 一 个 4x4 的 和 矩阵， 矩阵 元 素 为 随机 选择 的 大 写字 母 。 选 择 字 母 时 ， 必 须 保证 
被 选 字母 是 元 音 的 概率 为 50%。 编 写 测试 程序 ， 用 循环 调用 该 过 程 5 次 ， 并 在 控制 台 窗口 显示 所 
有 和 矩阵 。 前 三 次 抢 阵 的 示例 输出 如 下 所 示 : 


PVPOZZnrGo 
他 OGHGNYH 
PpPCOCOCMHO 
CNHoOoo<hHh 


HH 
9p 
A 
吕 名 


**x** 11. 字母 矩阵 / 按 元 音 分 组 
本 程序 以 上 一 道 编程 练习 生成 的 字母 卸 阵 为 基础 。 生 成 一 个 4x4 的 字母 矩阵 ， 其 中 每 个 字 
母 都 有 50% 的 概率 为 元 音字 母 。 遍 历 矩 阵 的 每 一 行 ， 每 一 列 ， 和 每 个 对 角 线 ， 并 产生 字母 组 。 当 
一 组 四 个 字母 中 只 有 两 个 元 音字 母 时 ， 显 示 该 字母 组 。 比 如 ， 假 设 生成 矩阵 如 下 所 示 ; 


POADLZ 
NEAU 
GKAE 
IAGD 


则 程序 应 显示 的 四 字母 组 为 POAZ、GKAE、IAGD、PAGI、ZUED、PEAD 和 ZAKI。 各 组 
内 字母 的 顺序 并 不 重要 。 
**x** 12. 数组 行 求 和 
编写 程序 calc_row_sum 计算 二 维 的 字 节 数组 、 字 数组 或 双 字 数组 中 单行 的 总 和 。 过 程 需 有 
如 下 堆栈 参数 : 数组 偏 移 量 、 行 大 小 、 数 组 类 型 、 行 索引 。 返 回 的 和 数 必须 在 EAX 中 。 要 求 使 用 
显 式 堆栈 参数 ， 不 能 用 INVOKE 或 扩展 的 PROC。 编 写 程序 ， 分 别 用 字 节 数组 、 字 数组 和 双 字 数 
组 来 测试 过 程 。 要 求 用 户 输入 行 索 引 ， 并 显示 被 选择 行 的 和 数 。 
*kx 13. 裁剪 前 导 字符 
编写 Str_trim 过 程 的 变 体 ， 使 得 主 调 程序 能 从 字符 串 中 删除 所 有 的 前 导 字 符 。 比 如 ， 若 调 
用 过 程 时 ， 有 一 指针 指向 字符 串 “ 需 #ABC"”， 且 向 过 程 传 递 了 字符 “#"”， 则 结果 字符 串 应 为 
“BC 
*** 14. 去 除 一 组 字符 
编写 Str_trim 过 程 的 变 体 ， 使 得 主 调 程序 能 从 字符 串 未 尾 删 除 一 组 字符 。 比 如 ， 若 调用 过 程 
时 ， 有 一 指针 指向 字符 串 “ ABC#$&”， 且 向 过 程 传递 了 过 滤 字 符 数组 “ %# ! ; $&*” 的 指针 ， 
则 结果 字符 串 应 为 “ABC ”。 
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10.1 结构 


结构 (structure) 是 一 组 逻辑 相关 变量 的 模板 或 模式 。 结 构 中 的 变量 被 称 为 字段 
( fields)。 程 序 语句 可 以 把 结构 作为 整体 进行 访问 ， 也 可 以 访问 其 中 的 单个 字段 。 结 构 常 常 
包含 不 同类 型 的 字段 。 联 合 (union) 也 会 把 多 个 标识 符 组 织 在 一 起 ,但 是 这 些 标识 符 会 在 内 
存 同一 区 域内 相互 重 玻 。 联 合 将 在 10.1.7 节 介 绍 。 

结构 提供 了 一 种 简便 的 方法 来 实现 数据 的 聚集 以 及 在 过 程 之 间 的 传递 。 假 设 一 过 程 的 输 
人 参数 包含 了 磁盘 驱动 的 20 个 不 同 单位 的 数据 ,那么 ,调用 这 种 过 程 很 容易 出 错 ， 因 为 程 
序 员 可 能 会 搞 混 参数 的 顺序 ， 或 是 搞 错 了 参数 的 个 数 。 相 反 则 可 以 把 所 有 的 输入 参数 放 到 一 
个 结构 中 ， 然 后 将 这 个 结构 的 地 址 传递 给 过 程 。 这 样 ， 使 用 的 堆栈 空间 将 最 少 (一 个 地 址 )， 
而 且 被 调用 过 程 还 可 以 修改 结构 的 内 容 。 

汇编 语言 中 的 结构 与 C 和 C++ 中 的 结构 同样 重要 。 只 需要 一 点 转换 ， 就 可 以 从 MS- 
Windows API 库 中 获得 任何 结构 ， 并 将 其 用 于 汇编 语言 。 大 多 数 调试 器 都 能 显示 各 个 结构 字段 。 

COORD 结构 Windows API 中 定义 的 COORD 结构 确定 了 屏幕 的 六 和 YY 坐标 。 相 对 
于 结构 起 始 地 址 ， 字 段 X 的 偏 移 量 为 0， 字 段 Y 的 偏 移 量 为 2: 


COORD STRUCT 
X WORD ? ; 偏 移 量 00 
Y WORD ? 7 偏 移 量 02 
COORD ENDS 


使 用 结构 包括 三 个 连续 的 步骤 : 

1 ) 定义 结构 。 

2 ) 声明 结构 类 型 的 一 个 或 多 个 变量 ， 称 为 结构 变量 (structure variables ) 。 
3 ) 编写 运行 时 指令 访问 结构 字段 。 


10.1.1 定义 结构 


定义 结构 使 用 的 是 STRUCT 和 ENDS 伪 指 令 。 在 结构 内 ， 定 义 字段 的 语法 与 一 般 的 变 
量 定义 是 相同 的 。 结 构 对 其 包含 字段 的 数量 几乎 没有 任何 限制 : 


name STRUCT 
field-declarations 
name ENDS 


字段 初始 值 ” 若 结构 字段 有 初始 值 ， 那 么 在 创建 结构 变量 时 就 要 进行 赋值 。 字 段 初 始 值 
可 以 使 用 各 种 类 型 : 

。 无 定义 : 运算 符 ? 使 字段 初始 值 为 无 定义 。 

e 字符 串 文 本 : 用 引号 括 起 的 字符 串 。 

e 整数 : 整数 常数 和 整数 表达 式 。 
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e。 数组 : DUP 运算 符 可 以 初始 化 数组 元 素 。 
下 面 的 Employee 结构 描述 了 雇员 信息 ， 其 包含 字段 有 ID 号 、 姓 氏 、 服 务 年 限 ， 以 及 
薪酬 历史 信息 数组 。 结 构 定义 如 下 所 示 ， 定 义 必须 在 声明 Employee 变量 之 前 : 
Employee STRUCT 
IdNum BYTE "000000000" 
LastName BYTE 30 DUP(0) 
Years WORD 0 


SalaryHistory DWORD 0,0,0,0 
Employee ENDS 


该 结构 内 存 保 存 形式 的 线性 表示 如 下 : 
["00000000"| (oy) | oo To To To 


IDNum LastName SalaryHistol 
Years 


对 齐 结构 字段 

为 了 获得 最 好 的 内 存 IO 性 能 ， 结 构成 员 应 按 其 数据 类 型 进行 地 址 对 齐 。 否 则 ，CPU 将 
会 花 更 多 时 间 访 问 成 员 。 例 如 ， 一 个 双 字 成 员 应 对 齐 到 双 字 边界 。 表 10-1 列 出 了 Microsoft 
C 和 C++ 编译 器 ， 以 及 Win32 API 函数 的 对 齐 方式 。 汇 编 语言 中 的 ALIGN 伪 指 令 会 使 其 后 
的 字段 或 变量 按 地 址 对 齐 : 

ALIGN datatype 


表 10-1 结构 成 员 对 齐 方式 
对 齐 到 32 位 ( 双 字 ) 边界 
[aa was | 对 齐 到 64 位 (四 字 ) 边界 
所 有 成 员 的 最 大 对 齐 要 求 
| 对 齐 到 64 位 (四 字 ) 边界 | union | 第 一 个 成 员 的 对 齐 要 求 


比如 ， 下 面 的 例子 就 把 myVar 对 齐 到 双 字 边界 : 


data 
ALIGN DWORD 
myVar DWORD ? 

















BYTE, SBYTE 
WORD, SWORD 
DWORD, SDWORD 










现在 正确 地 定义 Employee 结构， 利用 ALIGN 将 Years 按 字 (WORD) 边界 对 齐 ， 
SalaryHistory 按 双 字 (DWORD) 边界 对 齐 。 注 释 为 字段 大 小 : 


Employee STRUCT 


IdNum BYTE "000000000" 人 
LastName BYTE 30 DUP(0) ra 
ALIGN WORD ; 加 1 字 节 
Years WORD 0 和 
ALIGN DWORD ; 加 2 字 节 
SalaryHistory DWORD 0,0,0,0 ; 

Employee ENDS ; 共 60 字 节 


10.1.2 ”声明 结构 变量 


结构 变量 可 以 被 声明 ， 并 能 选择 为 是 否 用 特定 值 进行 初始 化 。 语 法 如 下 ， 其 中 
structureType 已 经 用 STRUCT 伪 指 令 定 义 过 了 : 
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Iaentifier structureType < initializer-list > 


identifier 的 命名 规则 与 MASM 中 其 他 变量 的 规则 相同 。initializer-list 为 可 选项 ， 但 是 
如 果 选 择 使 用 ， 则 该 项 就 是 一 个 用 逗号 分 隔 的 汇编 时 常数 列表 ， 需 要 与 特定 结构 字段 的 数据 
类 型 相 匹 配 : 


initializer [, initializer] . .. 
空 括号 过 使 结构 包含 的 是 结构 定义 的 默认 字段 值 。 此 外 ， 还 可 以 在 选 定 字 段 中 插入 新 


值 。 结 构 字段 中 的 插入 值 顺 序 为 从 左 到 右 ， 与 结构 声明 中 字段 的 顺序 一 致 。 这 两 种 方法 的 示 
例如 下 ， 使 用 的 结构 是 COORD 和 Employee: 


.data 

pointl COORD <5,10> FX= 5 Y= 10 
point2 COORD <20> ;X= 20, Y=? 
point3 COORD <> PD 
worker Employee <> ; 默认 初始 值 


可 以 只 覆盖 选 定 字段 的 初始 值 。 下 面 的 声明 只 覆盖 了 Employee 结构 的 Id4Num 字段 ， 而 
其 他 字段 仍 为 默认 值 : 


personl Employee <"555223333"> 
还 有 一 种 形式 是 使 用 大 括号 {…} 而 不 是 尖 括 号 : 


person2 Employee {"555223333"} 


若 字符 串 字段 初始 值 的 长 度 少 于 字段 的 定义 ， 则 多 出 的 位 置 用 空格 填充 。 空 字 节 不 会 自 
动 插 到 字符 串 字段 的 尾部 。 通 过 插 人 逗号 作为 位 置 标记 可 以 跳 过 结构 字段 。 例 如 ， 下 面 的 语 
句 就 跳 过 了 IdNum 字段 ， 初 始 化 了 LastName 字段 : 


person3 Employee <，"dJones "> 


数组 字段 使 用 DUP 运算 符 来 初始 化 某 些 或 全 部 数组 元 素 。 如 果 初 始 值 比 字段 位 数 少 ， 则 
多 出 的 位 置 用 零 填充 。 下 面 的 语句 只 初始 化 了 前 两 个 SalaryHistory 的 值 ， 而 其 他 的 值 则 为 0: 


person4 Employee <,,,2 DUP(20000)> 


结构 数组 DUP 运算 符 能 够 用 于 定义 结构 数组 ， 如 下 所 示 ，AllPoints 中 每 个 元 素 的 X 
和 YY 字段 都 被 初始 化 为 0: 

NumPoints = 3 

AllPoints COORD NumPoints DUP(<0,0>) 

对 齐 结构 变量 

为 了 最 好 的 处 理 器 性 能 ， 结 构 变 量 在 内 存 中 的 位 置 要 与 其 最 大 结构 成 员 的 边界 对 齐 。 
Employee 结构 包含 双 字 (DWORD) 字段 ， 因 此 ， 下 面 的 定义 使 用 了 双 字 对 齐 : 


data 
ALIGN DWORD 
person Employee <> 


10.1.3 引用 结构 变量 
使 用 TYPE 和 SIZEOF 运算 符 可 以 引用 结构 变量 和 结构 名 称 。 例 如 ， 现 在 回 到 之 前 的 
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Employee 结构 : 

Employee STRUCT 
IdNum BYTE "000000000" 区 
LastName BYTE 30 DUP(0) -5 
ALIGN WORD ; 加 1 字 节 
Years WORD 0 这 
ALIGN DWORD ; 加 2 字 节 
SalaryHistory DWORD 0,0,0,0 3 

Employee ENDS ; 共 60 字 节 

给 定数 据 定义 : 

data 


worker Employee <> 


则 下 列 所 有 表达 式 返 回 的 值 都 相同 : 


TYPE Employee ; 60 
SIZEOF Employee ; 60 
SIZEOF worker ; 60 


TYPE 运算 符 (4.4 节 ) 返回 的 是 标识 符 存储 类 型 (BYTE、WORD、DWORD 等 ) 的 


字 节 数 。LENGTHOF 运算 符 返回 的 是 数组 元 素 的 个 数 。SIZEOF 运算 符 则 为 LENGTHOF 
与 TYPE 的 乘积 。 


1. 引用 成 员 
引用 已 命名 的 结构 成 员 时 ， 需 要 用 结构 变量 作为 限定 符 。 以 Employee 结构 为 例 ， 在 汇 
编 时 能 生成 下 述 常 量 表达 式 : 





TYPE Employee.SalaryHistory ;4 

LENGTHOF Employee.SalaryHistory ; 4 

SIZEOF Employee.SalaryHistory 站 

TYPE Employee.Years 

以 下 为 对 worker (一 个 Employee) 的 运行 时 引用 : 
data 

worker Employee <> 

.code 

mov dx,worker.Years 

mov worker.SalaryHistory,20000 ; 第 一 个 工资 


mov [worker.SalaryHistory+4],30000 ; 第 二 个 工资 


使 用 OFFSET 运算 符 ” 使 用 OFFSET 运算 符 能 获得 结构 变量 中 一 个 字段 的 地 址 : 
mov edx,OFFSET worker.LastName 
2. 间接 和 变 址 操作 数 


间接 操作 数 用 寄存 器 (如 ESI) 对 结构 成 员 寻 址 。 间 接 寻 址 具有 灵活 性 ， 尤 其 是 在 向 过 
程 传递 结构 地 址 或 者 使 用 结构 数组 的 情况 下 。 引 用 间接 操作 数 时 需要 PTR 运算 符 : 


mov esi,OFFSET worker 
mov ax, (Employee PTR [esi]).Years 


下 面 的 语句 不 能 汇编 ， 原 因 是 Years 自身 不 能 表明 它 所 属 的 结构 : 


mov ax,[esi].Years ; 无 效 
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变 址 操作 数 用 变 址 操作 数 可 以 访问 结构 数组 。 假 设 department 是 一 个 包含 5 个 
Employee 对 象 的 数组 。 下 述 语句 访问 的 是 索引 位 置 为 1 的 雇员 的 Years 字段 : 


data 

department Employee 5 DUP(<>) 

.Code 

mov esi,TYPE Employee ;索引 = 1 
mov department|esi].Years, 4 


数组 循环 ” 带 间接 或 变 址 寻 址 的 循环 可 以 用 于 处 理 结构 数组 。 下 面 的 程序 ( AllPoints. 
asm) 为 AllPoints 数组 分 配 坐 标 : 


; 数组 循环 (AllPoints.asm) 


INCLUDE Irvine32 .inc 
NumPoints = 3 


.data 

ALIGN WORD 

AllPoints COORD NumPoints DUP(<0,0>) 

.Code 

main PROC 
mov edi,0 ; 数组 索引 
mov ”ecx,NumPoints 7 循环 计数 器 
mov ax,l 7 起 始 X、Y 的 值 


Ll: mov (COORD PTR AllPoints[edi]).X,ax 
mov (COORD PTR AllPoints[edi]).Y,ax 
add edi,TYPE COORD 
LNG ax 
loop Ll 
exit 

main ENDP 

END main 


3. 对 齐 的 结构 成 员 的 性 能 

之 前 已 经 断言 ， 处 理 器 访问 正确 对 齐 的 结构 成 员 时 效率 更 高 。 那 么 ， 非 对 齐 字段 会 对 性 
能 产生 多 大 影响 呢 ? 现在 使 用 本 章 介绍 的 Employee 结构 的 两 种 不 同 版 本 ， 进 行 一 个 简单 的 
测试 。 测 试 将 对 第 一 个 版 本 进行 重 命名 ， 以 便 两 种 版 本 能 在 同一 个 程序 中 使 用 : 


EmployeeBad STRUCT 
IdNum BYTE "000000000" 
LastName BYTE 30 DUP(0) 
Years WORD 0 
SalaryHistory DWORD 0,0,0,0 
EmployeeBad ENDS 


Employee STRUCT 
IdNum BYTE “000000000” 
LastName BYTE 30 DUP(0) 
ALIGN WORD 
Years WORD 0 
ALIGN DWORD 
SalaryHistory DWORD 0,0,0,0 
Employee ENDS 


下 面 的 代码 首先 获取 系统 时 间 ， 再 执行 循环 以 访问 结构 字段 ， 最 后 计算 执行 花费 的 时 
间 。 变 量 emp 可 以 声明 为 Employee 对 象 或 者 EmployeeBad 对 象 : 


结 欧 和 发 313 


data 
ALIGN DWORD 


startTime DWORD ? ; 对 齐 startTime 


emp Employee <> ; 或 : EmployeeBad 
-Code 
call GetMSeconds ; 获取 系统 时 间 


mov startTime,eax 

mov ecx,O0FFFFFFFFh ; 循环 计数 器 
Ll: mov emp.Years,5 

mov emp.SalaryHistory,35000 


loop Ll 

call GetMSeconds ; 获取 开始 时 间 

sub eax,startTime 

call WriteDec ; 显示 执行 花费 的 时 间 


在 这 个 简单 的 测试 程序 (Structl.asm) 中 ,使 用 正确 对 齐 的 Employee 结构 的 执行 时 间 为 
6141 毫秒 ， 而 使 用 EmployeeBad 结构 的 执行 时 间 为 6203 毫秒 。 两 者 相差 不 大 ( 62 毫秒 )， 
可 能 是 因为 处 理 器 的 内 存 cache 将 对 齐 问题 最 小 化 了 。 


10.1.4 示例 : 显示 系统 时 间 


MS-Windows 提供 了 设置 屏幕 光标 位 置 和 获取 系统 时 间 的 控制 台 函 数 。 要 使 用 这 些 函 
数 ， 先 为 两 个 预先 定义 的 结构 一 一 COORD 和 SYSTEMTIME 一 一 创建 实例 : 


COORD STRUCT 
X WORD ? 
Y WORD ? 

COORD ENDS 


SYSTEMTIME STRUCT 
wYear WORD 3? 
wMonth WORD ? 
wDayOfWeek WORD ? 
wDay WORD ? 
wHour WORD 3? 
wMinute WORD ? 
wSecond WORD ? 
wMilliseconds WORD ? 
SYSTEMTIME ENDS 


这 两 个 结构 都 在 SmallWin.inc 中 进行 了 定义 ， 这 个 文件 位 于 汇编 器 的 INCLUDE 目录 
下 ,并 且 由 Irvine32.inc 引用 。 首 先 获 取 系 统 时 间 (调整 本 地 时 间 )， 调 用 MS-Windows 的 
GetLocalTime 函数 ， 并 向 其 传递 SYSTEMTIME 结构 的 地 址 : 


.data 

sysTime SYSTEMTIME <> 

.code 

INVOKE GetLocalTime, ADDR sysTime 


接着 ， 从 SYSTEMTIME 结构 检索 相应 的 数值 : 


movzx eax,sysTime.wYear 
call WriteDec 






SmallWin.inc 文件 位 于 本 书 的 安装 软件 文件 天 中 ， 包 含 的 结构 定义 和 函数 原型 改编 
自 针 对 C 和 C++ 程序 员 的 Microsoft Windows 头 文件 。 它 代表 了 一 小 部 分 可 能 被 应 用 程 
序 调用 的 函数 。 





314 盆 10 章 





当 Win32 程序 产生 屏幕 输出 时 ， 它 要 调用 MS-Windows GetStdHandle 函数 来 检索 标准 
控制 台 输 出 句柄 (一 个 整数 ): 


data 

consoleHandle DWORD ? 

Code 

INVOKE GetStdHandle, STD OUTPUT HANDLE 
mov consoleHandle,eax 


397 (常数 STD_OUTPUT_HANDLE 在 SmallWin.inc 中 定义 。) 
设置 光标 位 置 要 调用 MS-Windows SetConsoleCursorPosition 函数 ， 并 向 其 传递 控制 台 
输出 句柄 ， 以 及 包含 X、Y 字符 坐标 的 COORD 结构 变量 : 


.data 

XYPos COORD <10,5> 

.code 

INVOKE SetConsoleCursorPosition, consoleHandle, XYPos 


程序 清单 ”下 面 的 程序 (ShowTime.asm) 检索 系统 时 间 ， 并 将 其 显示 在 指定 的 屏幕 位 
置 。 该 程序 只 在 保护 模式 下 运行 : 


;结构 (ShowTime .asm) 
INCLUDE Irvine32.inc 

.data 

sysTime SYSTEMTIME <> 

XYPos COORD <10,5> 

consoleHandle DWORD ? 

colonstr BYTE ":",0 


.code 
main PROC 
; 获取 Win32 控制 台 的 标准 输出 句柄 。 
INVOKE GetStdHandle，STD_OUTPUT_HRANDLE 
mov consoleHandle,eax 
; 设置 光标 位 置 并 获取 系统 时 间 。 
INVOKE SetConsoleCursorPosition, consoleHandle, XYPos 
INVOKE GetLocalTime, ADDR sysTime 


;显示 系统 时 间 ( 小 时 : 分 钟 : 秒 ) 


movzx eax,sysTime.wHour ; 小 时 
call WriteDec 

mov edx,OFFSET colonstr i 
call Writestring 

movzx eax,sysTime.wMinute ; 分 钟 


call WriteDec 
call Writestring 


movzx eax,sysTime.wSecond ; 秒 
call WriteDec 
call CrILE 
call WaitMsg ; "Press any key..." 
exit 
main ENDP 
END main 


SmallWin.inc (自动 包含 在 Irvine32.inc 中 ) 中 的 上 述 程 序 采用 如 下 定义 : 


STD _ OUTPUT HANDLE EQU -11 
SYSTEMTIME STRUCT ... 


COORD STRUCT ... 
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GetSstdHandle PROTO, 
nSstdHandle:DWORD 


GetLocalTime PROTO, 
lpSystemTime:PTR SYSTEMTIME 


SetConsoleCursorPosition PROTO, 
nSstdHandle:DWORD, 
Coords:COORD 


下 面 是 示例 程序 输出 ， 执 行 时 间 为 下 午 12: 16: 


12:16:35 


Press any key to continue... 


10.1.5 ”结构 包含 结构 


结构 还 可 以 包含 其 他 结构 的 实例 。 例 如 ， Rectangle 可 以 用 其 左上 角 和 右 下 角 来 定义 ， 
而 它们 都 是 COORD 结构 : 


Rectangle STRUCT 
UpperLeft COORD <> 
LowerRight COORD <> 

Rectangle ENDS 


Rectangle 变量 可 以 被 声明 为 不 覆盖 或 者 覆盖 单个 COORD 字段 。 各 种 表达 形式 如 下 所 示 : 


rectl Rectangle < > 
rect2 Rectangle { } 
rect3 Rectangle { {10,10}, {50,20} } 
rect4 Rectangle < <10,10>, <50,20> > 


下 面 是 对 其 一 个 结构 字段 的 直接 引用 : 


mov rectl.UpperLeft.xX, 10 


也 可 以 用 间接 操作 数 访 问 结构 字段 。 下 例 用 ESI 指向 结构 ， 并 把 10 送 入 该 结构 左上 和 角 
的 Y 坐标 : 
mov esi,OFFSET rectl 


mov (Rectangle PTR [esi]).UpperLeft.Y, 10 


OFFSET 运算 符 能 返回 单个 结构 字段 的 指针 ， 包 括 幅 套 字段 : 


mov edi,OFFSET rect2.LowerRight 
mov (COORD PTR [edi]).X, 50 

mov edi,OFFSET rect2 .LoweIRight .X 
mov WORD PTR [edi], 50 


10.1.6 示例 : 醉 汉 行走 

现在 来 看 一 个 使 用 结构 的 小 程序 将 会 有 所 帮助 。 下 面 完 成 一 个 “ 醉 汉 行走 ”练习 ， 用 程 
序 模拟 一 个 不 太 清醒 的 教授 从 计算 机 科学 假期 聚会 回 家 的 路 线 。 利 用 随机 数 生成 器 ， 选 择 该 
教授 每 一 步行 走 的 方向 。 假 设 教授 处 于 一 个 虚构 的 网 格 中心 ， 其 中 的 每 个 方 格 代表 的 是 北 、 
南 、 东 、 西 方向 上 的 一 步 。 现 在 按照 随机 路 径 通过 网 格 (图 10-1 )。 

本 程序 将 使 用 COORD 结构 追踪 这 个 人 行走 路 径 上 的 每 一 步 ， 它 们 被 保存 在 一 个 
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COORD 对 象 数组 中 。 


WalkMax = 50 
DrunkardWalk STRUCT 
path COORD WalkMax DUP(<0,0>) 
pathsUsed WORD 0 
DrunkardWwalk ENDS 





图 10-1 醉 汉 行 走 的 示例 路 径 


Walkmax 是 一 个 常数 ， 决 定 在 模拟 中 教授 能 够 行走 的 总 步 数 。pathsUsed 字段 表示 在 程 


序 循环 结束 后 ， 一 共 行 走 了 多 少 步 。 教 授 每 走 一 步 ， 其 位 置 就 被 记录 在 COORD 对 象 中 ,并 
插入 path 数组 下 一 个 可 用 的 位 置 。 程 序 将 在 屏幕 上 显示 这 些 坐 标 。 以 下 是 完整 的 程序 清单 ， 
需 在 32 位 模式 下 运行 : 


; 醉 汉 行走 (Walk.asm) 

; 醉 汉 行走 程序 。 教 授 的 起 点 坐标 为 (25，25) ， 并 在 周围 徘徊 。 
INCLUDE Irvine32.inc 

WalkMax = 50 

StartX = 25 
StartyY = 25 


DrunkardWalk STRUCT 
Path COORD WalkMax DUP(<0,0>) 


pathsUsed WORD 0 
DrunkardWwalk ENDS 


DisplayPosition PROTO currX:WORD, currY:WORD 


.data 
amalk Drunkardwalk <> 


-Code 

main PROC 
mov esi,OFFSET aWalk 
call TakeDrunkenWalk 
exit 

main ENDP 


; 
TakeDrunkenWalk PROC 
LOCAL currX:WORD, currY :WORD 
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; 向 随机 方向 行走 ( 北 、 南 、 东 、 西 ) 
; 接收 : ESI 为 DrunkardWalk 结构 的 指针 
5 a ls 结构 初始 化 为 随机 数 


;? 用 OFFSET 运算 符 获取 path 一 一 COORD 对 象 数组 一 的 地 址 ， 并 将 其 复制 到 EDI。 
mov edi,esi 
add edi,OFFSET DrunkardWalk .path 


mov ecx,WalkMax ; 循环 计数 器 

mov currx,startx ; 当前 X 的 位 置 

mov CcurryY,Starty ; 当前 Y 的 位 置 
Again: 


; 把 当前 位 置 插入 数组 

mov ax,currxX 

mov (COORD PTR [edi]).X,ax 
mov ax,currYy 

mov (COORD PTR [edi]).Y,ax 


INVOKE DisplayPosition, currX, currYyY 


mov eax,4 ; 选择 一 个 方向 (0-3) 
call RandomRange 
.IF eax == 0 7 北 
dec CurrY 
.ELSEIF eax = 
Lne curry 
ELSEIF eax = 
dec currx 
.ELSE ; 东 (EAX=3) 
inc currX 
,ENDIF 7 指向 下 一 个 COORD 


add edi,TYPE COORD 
loop Again 


; 南 


外 
请 


; 西 


hl 
Ld 


Finish: 
mov (DrunkardWalk PTR [esi]).pathsUsed, WalkMax 
popad 
ret 

TakeDrunkenWalk ENDP 


DisplayPosition PROC currX:WORD, currY:WORD 
?显示 当前 Xx 和 YY 的 位 置 。 


data 
commastr BYTE ",",0 
"Code 
pushad 
moOVZx eax,currX ; 当前 X 的 位 置 
call WriteDec 
mov edx,OFFSET CommaStT 
call Writestring 
IOVZX eax,curry ; 当前 Y 的 位 置 
call WriteDec 
Call Crlf 
popad 
ret 
DisplayPosition ENDP 
END main 


现在 进一步 查看 TakeDrunkenWalk 过 程 。 过 程 接收 指向 DrunkardWalk 结构 的 指针 


;“，,” 字 符 串 


318 荔 10 介 


(EST)， 利 用 OFFSET 运算 符 计算 path 数组 的 偏 移 量 ， 并 将 其 复制 到 EDI: 


mov edi,esi 
add edi,OFFSET DrunkardWalk.path 


教授 初始 位 置 的 多 和 YY 值 (StartX 和 StartY) 都 被 设置 为 25, 位 于 50 x 50 虚拟 网 格 的 
中 点 。 循 环 计数 器 也 进行 了 初始 化 : 


mov ecx，WalkMax  ，; 循环 计数 器 
mov currX,StartXx ;当前 X 的 位 置 
mov currY,StartY  ; 当前 Y 的 位 置 


循环 开始 时 ， 对 path 数组 的 第 一 项 进行 初始 化 : 
Again: 


; 将 当前 位 置 插入 数组 。 

mov ax,Ccurrx 

mov (COORD PTR [edi]).X,ax 
mov ax,currYyY 

mov (COORD PTR [edi]).Y,ax 


路 径 结束 时 ， 在 pathsUsed 字段 插入 一 个 计数 值 ， 表 示 总 共 走 了 多 少 步 : 
inish: 
mov (DrunkardWalk PTR [esi]).pathsUsed, WalkMax 
在 当前 的 程序 中 ，pathsUsed 总 是 等 于 WalkMax。 不 过 ， 若 在 行走 过 程 中 发 现 障 碍 ， 如 
湖泊 或 建筑 物 ， 情 况 就 会 发 生变 化 ， 循 环 将 会 在 达到 WalkMax 之 前 结束 。 


10.1.7 声明 和 使 用 联合 


结构 中 的 每 个 字段 都 有 相对 于 结构 第 一 个 字 节 的 偏 移 量 ， 而 联合 (union) 中 所 有 的 字段 
则 都 起 始 于 同一 个 偏 移 量 。 一 个 联合 的 存储 大 小 即 为 其 最 大 字段 的 长 度 。 如 果 不 是 结构 的 组 
成 部 分 ， 那 么 需要 用 UNION 和 ENDS 伪 指 令 来 定义 联合 : 


unionname UNION 
union-fields 
unionname ENDS 


如 果 联 合 艇 套 在 结构 内 ， 其 语法 会 有 一 点 不 同 : 


structname STRUCT 
structure-fields 
UNION unionname 
union-fields 
ENDS 
structname ENDS 


除了 其 每 个 字段 都 只 有 一 个 初始 值 之 外 ， 联 合 字段 声明 的 规则 与 结构 的 规则 相同 。 例 
如 ，Integer 联合 对 同一 个 数据 声明 了 3 种 不 同 的 大 小 属性 ， 并 将 所 有 的 字段 都 初始 化 为 0: 


Integer UNION 
D DWORD 0 
W WORD 0 
B BYTE 0 

Integer ENDS 


一 致 性 ”如 果 使 用 初始 值 ， 那 么 它们 必须 为 相同 的 数值 。 假 设 Integer 声明 了 3 个 不 同 
的 初始 值 : 
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Integer UNION 
D DWORD 1 
W WORD 5 
B BYTE 3 

Integer ENDS 


同时 还 假设 声明 了 一 个 Integer 变量 myInt 使 用 默认 初始 值 : 


.data 
myInt Integer <> 


结果 发 现 ，myInt.D 、myInt.W 和 myInt.B 都 等 于 1。 字 段 W 和 B 中 声明 的 初始 值 会 被 
汇编 器 忽略 。 

结构 包含 联合 ”在 结构 声明 中 使 用 联合 的 名 称 ， 就 可 以 使 联合 典 套 在 这 个 结构 中 。 方 法 
如 同 下 面 在 FileInfo 结构 中 声明 FileID 字段 一 样 : 


FileInfo STRUCT 
FileID Integer <> 
FileName BYTE 64 DUP(?) 
FileInfo ENDS 


还 可 以 直接 在 结构 中 定义 联合 ， 方 法 如 同 下 面 定义 FileID 字段 一 样 : 


FileIinfo STRUCT 
UNION FileID 
D DWORD ? 
W WORD ? 
B BYTE ? 
ENDS 
FileName BYTE 64 DUP(?) 
FileInfo ENDS 


声明 和 使 用 联合 变量 联合 变量 的 声明 和 初始 化 方法 与 结构 变量 相同 ， 只 除了 一 个 重要 
的 差异 : 不 允许 初始 值 多 于 一 个 。 下 面 是 Integer 类 型 变量 的 例子 : 


Vall Integer <12345678h> 
val2 Integer <100h> 
val3 Integer <> 


在 可 执行 指令 中 使 用 联合 变量 时 ， 必 须 给 出 字段 的 一 个 名 称 。 下 面 的 例子 把 寄存 器 的 值 
赋 给 了 Integer 联合 字段 。 注 意 其 可 以 使 用 不 同 操作 数 大 小 的 灵活 性 : 
mov val3.B, al 


mov val3.W, ax 
mov val3.D, eax 


联合 还 可 以 包含 结构 。 有 些 MS-Windows 控制 台 输 入 函数 会 使 用 如 下 INPUT_RECORD 
结构 ， 它 包含 了 一 个 名 为 Event 的 联合 ， 这 个 联合 对 几 个 预定 义 的 结构 类 型 进行 选择 。 
EventType 字段 表示 联合 中 出 现 的 是 哪 种 record。 每 一 种 结构 都 有 不 同 的 布局 和 大 小 ， 但 是 
一 次 只 能 使 用 一 种 : 


INPUT RECORD STRUCT 
EventType WORD ? 
ALIGN DWORD 
UNION Event 
KEY EVENT RECORD <> 
MOUSE EVENT RECORD <> 
WINDOW BUFFER SIZE RECORD <> 
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MENU_EVENT RECORD <> 
FOCUS EVENT RECORD <> 
ENDS 
INPUT_RECORD ENDS 


Win32 API 在 命名 结构 时 ， 常 常 使 用 单词 RECORD。KEY_EVENT_RECORD 结构 的 定 
义 如 下 所 示 : 


KEY EVENT RECORD STRUCT 


bKeyDown DWORD ? 
wRepeatCount WORD 3? 
wVirtualKeyCode WORD ? 
wVirtualScancode WORD  ? 


UNION uChar 


UnicodeChar WORD 3? 
AsciiChar BYTE 
ENDS 


dwControlKeyState DWORD ? 
KEY EVENT RECORD ENDS 


SmallWin.inc 文件 中 可 以 找到 INPUT_RECORD 其 余 的 STRUCT 定义 。 


10.1.8 本 节 回 顾 
问题 1 一 9 参考 如 下 结构 : 


MyStruct STRUCT 

fieldl WORD ? 

field2 DWORD 20 DUP(?) 
MyStruct ENDS 


. 用 默认 值 声明 变量 MyStruct。 

.声明 变量 MyStruct， 将 第 一 个 字段 初始 化 为 0。 

.声明 变量 MyStruct、 将 第 二 个 字段 初始 化 为 全 零 数 组 。 

. 一 数组 包含 20 个 MyStruct 对 象 ， 将 该 数组 声明 为 变量 。 

. 对 上 一 题 的 MyStruct 数组 ， 把 第 一 个 数组 元 素 的 fieldl 送 入 AX。 

. 对 上 一 题 的 MyStruct 数组 ， 用 ESI 索 引 第 3 个 数组 元 素 ， 并 将 AX 送 入 field1。 
提示 : 使 用 PTR 运算 符 。 

7. 表达 式 TYPE MyStruct 的 返回 值 是 多 少 ? 

8. 表达 式 SIZEOF MyStruct 的 返回 值 是 多 少 ? 

9. 编写 一 个 表达 式 ， 返 回 MyStruct 中 field2 的 字 节 数 。 


nm 已 一 


10.2: 宏 


10.2.1 概述 


宏 过 程 (macro procedure) 是 一 个 命名 的 汇编 语句 块 。 一 旦 定义 好 了 ， 它 就 可 以 在 程序 
中 多 次 被 调用 。 在 调用 宏 过 程 时 ， 其 代码 的 副本 将 被 直接 插入 到 程序 中 该 宏 被 调用 的 位 置 。 
这 种 自动 插入 代码 也 被 称 为 内 联展 开 (inline expansion)。 尽 管 从 技术 上 来 说 没有 CALL 指 
令 , 但 是 按照 惯例 仍然 说 调用 (calling) 宏 过 程 。 
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提示 Microsoft 汇编 程序 手册 中 的 术语 宏 过 程 是 指 无 返回 值 的 宏 。 还 有 一 种 宏 函 数 


( macro function) 则 有 返回 值 。 在 程序 员 中 ， 单 词 宏 ( macro) 通常 被 理解 为 宏 过 程 。 从 
现在 开始 ， 本 书 将 使 用 宏 这 个 简短 的 称呼 。 





位 置 ” 宏 定义 一 般 出 现在 程序 源 代码 开始 的 位 置 ,或 者 是 放 在 独立 文件 中 ， 再 用 
INCLUDE 伪 指 令 复 制 到 程序 里 。 宏 在 汇编 器 预 处 理 (preprocessing) 阶段 进行 扩展 ， 在 这 个 
阶段 中 ， 预 处 理 程 序 读 取 宏 定 义 并 扫描 程序 剩余 的 源 代码 。 每 到 宏 被 调用 的 位 置 ， 汇 编 器 就 
将 宏 的 源 代码 复制 插入 到 程序 中 。 汇 编 器 在 调用 宏 之 前 ， 必 须 先 找到 宏 定义 。 如 果 程 序 定义 
了 宏 但 却 没有 调用 它 ， 那 么 在 编译 好 的 程序 中 不 会 出 现 宏 代码 。 

在 下 例 中 ， 宏 PrintX 调用 了 Irvine32 链接 库 的 WriteChar 过 程 。 这 个 定义 通常 会 被 放置 
在 数据 段 之 前 : 


PrintX MACRO 
mov al,'X" 
call WriteChar 
ENDM 


接着 ,在 代码 段 中 调用 这 个 宏 : 


.Code 
Printx 


当 预 处 理 程 序 扫描 这 个 程序 并 发 现 对 PrintX 的 调用 后 ， 它 就 用 如 下 语句 替换 宏 调 用 : 


mov alL，X' 
call WriteChar 


这 里 发 生 的 是 文本 替换 。 虽 然 宏 有 点 不 灵活 ， 但 后 面 很 快 就 会 展示 如 何 向 宏 传递 实 参 ， 
使 它们 变 得 更 有 用 ， 


10.2.2 ”定义 宏 
定义 一 个 宏 使 用 的 是 MACRO 和 ENDM 伪 指 令 ， 其 语法 如 下 所 示 : 
macroname MACRO parameter-1, parameter-2... 


statement-list 
ENDM 


关于 缩 进 没有 硬性 规定 ， 但 是 还 是 建议 对 macroname 和 ENDM 之 间 的 语句 进行 缩 进 。 
同时 ， 还 希望 在 宏 名 上 使 用 前 级 m， 形 成 易 识别 的 名 称 ， 如 mPutChar，mWriteString 和 
mGotoxy。 除 非 宏 被 调用 ， 否 则 MACRO 和 ENDM 伪 指 令 之 间 的 语句 不 会 被 汇编 。 宏 定义 
中 还 可 以 有 多 个 形 参 ， 参 数 之 间 用 逗号 隔 开 。 

参数 ” 宏 形 参 (macro parameter) 是 需 传递 给 调用 者 的 文本 实 参 的 命名 占 位 符 。 实 参 实 
际 上 可 能 是 整数 、 变 量 名 或 其 他 值 ， 但 是 预 处 理 程序 把 它们 都 当做 文本 。 形 参 不 包含 类 型 信 
息 ， 因 此 ， 预 处 理 程序 不 会 检查 实 参 类 型 来 看 它们 是 否 正 确 。 如 果 发 生 类 型 不 匹配 ， 它 将 会 
在 宏 展开 之 后 ， 被 汇编 器 捕获 。 

mPutChar 示例 ”下 面 宏 mPutChar 接收 一 个 名 为 char 的 输入 形 参 ， 通 过 调用 本 书 链接 
库 的 WriteChar 将 其 显示 在 控制 台 : 


mpPutchar MACRO char 
push eax 
mov al,char 
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call WriteChar 
pop eax 
ENDM 


10.2.3 ”调用 宏 
调用 宏 的 方法 是 把 宏 名 插入 到 程序 中 ,后 面 可 能 跟 有 宏 的 实 参 。 宏 调用 语法 如 下 : 


macroname argument-1, argument-2, ... 


Macroname 必须 是 源 代码 中 在 此 之 前 被 定义 宏 的 名 称 。 每 个 实 参 都 是 文本 值 ， 用 以 替换 
宏 的 一 个 形 参 。 实 参 的 顺序 要 与 形 参 一 致 ,， 但 是 两 者 的 数量 不 须 相 同 。 如 果 传 递 的 实 参 数 太 
多 ， 则 汇编 器 会 发 出 警告 。 如 果 传 递 给 宏 的 实 参数 太 少 ， 则 未 填充 的 形 参 保持 为 空 。 

调用 mPutChar 上 一 节 定 义 了 宏 mPutChar。 调 用 mPutChar 时 ， 可 以 传递 任何 字符 或 
ASCII 码 。 下 面 的 语句 调用 了 mPutChar， 并 向 其 传递 了 字母 “A”: 


mputchar “有 


汇编 器 的 预 处 理 程序 将 这 条 语句 展开 为 下 述 代 码 ， 以 列表 文件 的 形式 展开 如 下 : 


1 push eax 

1 mov al, A’ 

1 call WriteChar 
1 pop eax 


左 侧 的 1 表示 宏 展开 的 层次 ， 如 果 在 宏 的 内 部 又 调用 了 其 他 的 宏 ， 那么 该 值 将 会 增加 。 
下 面 的 循环 显示 了 字母 表 中 前 20 个 字母 : 


mov aly A 
mov ecx,20 
Ukes 
mPutchar al ; 宏 调用 
inc al 
loop Ll 


该 循环 由 预 处 理 程序 在 下 面 的 代码 中 展开 ( 源 列表 文件 中 可 见 )， 其 中 ， 宏 调用 在 其 展 
开 的 前 面 : 


BY ‘al A 
mov ecx,20 
Ll: 
mPutchar al ; 调用 宏 
push eax 
mov al,al 
call WriteChar 
pop eax 
ine “al 
loop L1 


提示 通常 ， 与 过 程 相 比 ， 宏 执行 起 来 更 快 ， 其 原因 是 过 程 的 CALL 和 RET 指令 


PP 


需要 额外 的 开销 。 但 是 ， 使 用 宏 也 有 缺点 : 重复 使 用 大 型 宏 会 增加 程序 的 大 小 ， 因 为 ， 
每 次 调用 宏 都 会 在 程序 中 插入 宏 代 码 的 一 个 新 副本 。 


调试 宏 
调试 使 用 了 宏 的 程序 相当 具有 挑战 性 。 程 序 汇 编 之 后 ， 检 查 其 列表 文件 (扩展 名 
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为 .LST) 以 确保 每 个 宏 都 按照 程序 员 的 要 求 展 开 。 然 后 ， 在 Visual Studio 调试 器 中 启动 该 
程序 ， 在 调试 窗口 点 击 右键 ， 从 弹出 菜单 中 选择 Go to Disassembly。 每 个 宏 调 用 的 后 面 都 紧 
跟 其 生成 代码 。 示 例如 下 : 


mWriteaAt 15,10,"Hi there" 
push edx 
mov dh, OAh 
mov dl,0rFh 
call Gotoxy@0 (401551h) 
pop edx 
push edx 
mov edx,offset ?3?0000 (405004h) 
call Writestring@0 (401D64h) 
pop edx 


由 于 Irvine32 链接 库 使 用 的 是 STDCALL 调用 规范 ， 因 此 函数 名 用 下 划 线 (_) 开始 。 


10.2.4 ”其 他 宏 特 性 


1. 规定 形 参 

利用 REQ 限定 符 ， 可 以 指定 必需 的 宏 形 参 。 如 果 被 调用 的 宏 没 有 实 参 与 规定 形 参 相 匹 
配 ， 那 么 汇编 器 将 显示 出 错 消息 。 如 果 一 个 宏 有 多 个 规定 形 参 ， 则 每 个 形 参 都 要 使 用 REQ 
限定 符 。 下 面 是 宏 mPutChar， 形 参 char 是 必需 的 : 


mputchar MACRO char:REQ 
push eax 
mov al,char 
call WriteChar 
pop eax 

ENDM 


2. 宏 注 释 
宏 定 义 中 的 注释 行 一 般 都 出 现在 每 次 宏 展开 的 时 候 。 如 果 和 希望 忽略 宏 展开 时 的 注释 ， 就 
在 它们 的 前 面 添加 双 分 号 (; ; )。 示 例如 下 : 


mPutchar MACRO char:REOQ 
push eax ;; 提示 : char 必须 包含 8 个 比特 
mov al,char 
call WriteChar 
pop eax 
ENDM 


3. ECHO 伪 指 令 


在 程序 汇编 时 ，ECHO 伪 指 令 写 一 个 字符 串 到 标准 输出 。 下 面 的 mPutChar 在 汇编 时 会 
显示 消息 “Expanding the mPutChar macro ”: 


mputchar MACRO char:REQ 
ECHO Expanding the mPutchar macro 
push eax 
mov al,char 
call WriteChar 
pop eax 
ENDM 


提示 Visual Studio 2012 的 控制 台 窗 口 不 会 捕捉 ECHO 伪 指 令 的 输出 ， 除 非 在 编 





写 程序 时 将 其 设置 为 生成 详细 输出 。 设 置 方法 如 下 : 从 Tool 菜单 选择 Options， 选 择 
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Projects and Solutions， 选 择 Build and Run， 再 从 MSBuild project build output verbosity 
下 拉 列 表 中 选择 Detailed。 或 者 打开 一 个 命令 提示 符 并 汇编 程序 。 首 先 ， 执 行 如 下 命令 ， 
调整 Visual Studio 当前 版 本 的 路 径 : 


"C:\Program Files\Microsoft Visual Studio 11.0\VvC\bin\vevars32" 


然后 ， 键 入 如 下 指令 ， 其 中 filename.asm 是 程序 的 源 代码 文件 名 : 


ml.exe /c /I "c:\Irvine" filename.asm 





4. LOCAL 伪 指 令 
宏 定义 中 常常 包含 了 标号 ， 并 会 在 其 代码 中 对 这 些 标号 进行 自 引 用 。 例 如 ， 下 面 的 宏 
makeString 声明 了 一 个 变量 string， 且 将 其 初始 化 为 字符 数组 : 


makeString MACRO text 
data 
string BYTE text,0 
ENDM 


假设 两 次 调用 宏 : 


makeString "Hello" 
makeString "Goodbye" 


由 于 汇编 器 不 允许 两 个 标号 有 相同 的 名 字 ， 因 此 结果 出 现 错误 : 


makeString "Hello" 
.data 
J string BYTE "Hello",0 
makeString "Goodbye" 
1 .data 
1 string BYTE "Goodbye",0 ; 错误! 


使 用 LOCAL 为 了 避免 标号 重 命名 带 来 的 问题 ， 可 以 对 一 个 宏 定义 内 的 标号 使 用 
LOCAL 伪 指 令 。 若 标号 被 标记 为 LOCAL， 那 么 每 次 进行 宏 展 开 时 ， 预 处 理 程序 就 把 标号 
名 转换 为 唯一 的 标识 符 。 下 面 是 使 用 了 LOCAL 的 宏 makeString : 


makeString MACRO text 
LOCAL string 
.data 
string BYTE text,0 
ENDM 


假设 和 前 面 一 样 ， 也 是 两 次 调用 宏 ， 预 处 理 程序 生成 的 代码 会 将 每 个 string 替换 成 唯一 
的 标识 符 : 


makeString "Hello" 

1 -data 

1 ??0000 BYTE "Hello",0 
makeString "Goodbye" 

1 data 

1 ?3?0001 BYTE "Goodbye",0 


汇编 器 生成 的 标号 名 使 用 了 ? ? nnnn 的 形式 ， 其 中 nnnn 是 具有 唯一 性 的 整数 。 
LOCAL 伪 指 令 还 可 以 用 于 宏 内 的 代码 标号 。 
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5. 包含 代码 和 数据 的 宏 
宏 通 常 既 包 含 代码 又 包含 数据 。 例 如 ， 下 面 的 宏 mWrite 在 控制 台 显示 文本 字符 串 : 


mWrite MACRO text 


LOCAL string ;?local 标号 
.data 77 定义 字符 囊 
string BYTE text,0 

‘Code 

push edx 


mov edx,OFFSET string 
call WriteString 
pop edx 

ENDM 


下 面 的 语句 两 次 调用 宏 ， 并 向 其 传递 不 同 的 字符 串 文本 : 


mWNrite "Please enter your first name" 
mWrite "Please enter your last name" 


汇编 器 对 这 两 条 语句 进行 展开 时 ， 每 个 字符 串 都 被 赋予 了 唯一 的 标号 ， 且 MOYV 指令 也 
作 了 相应 的 调整 : 


mWrite "Please enter your first name" 

.data 

?3?30000 BYTE "Please enter your first name",0 
.Code 

push edx 

mov edx,OFFSET ??0000 

call Writestring 

pop edx 

mWrite "Please enter your last name" 

.data 

??0001 BYTE "Please enter your last name",0 
.Code 

Push edx 

mov edx,OFFSET ??0001 

call Writestring 

pop edx 


6. 宏基 套 
被 其 他 宏 调 用 的 宏 称 为 被 说 套 的 宏 (nested macro) 。 当 汇编 器 的 预 处 理 程序 遇 到 对 被 炭 
套 宏 的 调用 时 ， 它 会 就 地 展开 该 宏 。 传 递 给 主 调 宏 的 形 参 也 将 直接 传递 给 它 的 被 散 套 宏 。 


"PPPPPr 


FF PH 





mWriteln 示例 ”下 面 的 宏 mWriteIn 写 一 个 字符 串 文 本 到 控制 台 ， 并 添加 换行 符 。 它 调 
用 宏 mWrite 和 Crlf 过 程 : 


mWwriteln MACRO text 
mwrite text 
call CETE 
ENDM 


形 参 text 被 直接 传递 给 mWrite。 假 设 用 下 述 语句 调用 mWriteLn: 


mWwriteln "MY Sample Macro Program" 


410 


412 
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在 结果 代码 展开 ,语句 旁边 的 柑 套 级 数 ( 2 ) 表示 被 调用 的 是 一 个 虚 套 宏 : 


mWriteln "MY Sample Macro Program" 
.data 


?2?0002 BYTE "My Sample Macro Program",0 
.code 


push edx 

mov edx,OFFSET ?2?20002 
call WriteString 

pop edx 

Sa Cl 


FDINDDNDINDNDNDPD 


10.2.5 ”使 用 本 书 的 宏 库 ( 仅 32 位 模式 ) 


本 书 提供 的 示例 程序 包含 了 一 个 小 而 实用 的 32 位 链接 库 ， 只 需要 在 程序 的 INCLUDE 
后 面 添 加 如 下 代码 行 就 可 以 使 用 该 链接 库 : 


INCLUDE Macros.inc 
有 些 宏 封装 在 了 Irvine32 链接 库 的 过 程 中 ， 这 样 传 递 参 数 就 更 加 容易 。 其 他 宏 则 提供 新 
的 功能 。 表 10-2 详细 介绍 了 每 个 宏 ， 示例 代码 在 MacroTest.asm 中 。 
表 10-2 Macro.inc 库 中 的 宏 


宏 名 说 明 
mDump 用 变量 名 和 默认 属性 显示 一 个 变量 
DumpMem 显示 内 存 区 二 
mGotoxy 将 光标 位 置 设置 在 控制 台 窗 口 缓冲 区 
mReadString 从 键盘 读 取 一 个 字符 串 
mShow 用 各 种 格式 显示 一 个 变量 或 寄存 器 
mShowRegister 显示 32 位 寄存 器 名 ， 并 用 十 六 进 制 显示 其 内 容 
mWrite | text | 向 控制 台 窗口 输出 一 个 字符 串 文本 
mWriteSpace | comt | 向 控制 台 窗 口 输出 一 个 或 多 个 空格 
mWriteSting | buffer | 控制 台 窗口 输出 一 个 字符 串 变 量 的 内 容 


1.mDumpMem 

宏 mDumpMem 在 控制 台 窗 口 显 示 一 个 内 存 区 域 。 向 其 传递 的 第 一 个 实 参 为 包含 待 显示 
内 存 偏 移 量 的 常数 、 寄 存 器 或 者 变量 ， 第 二 个 实 参 应 为 待 显 示 内 存 中 存储 对 象 的 数量 ， 第 三 
个 实 参 为 每 个 存储 对 象 的 大 小 。( 宏 在 调用 mDumpMem 库 过 程 时 ， 分 别 将 这 三 个 实 参 分 配 
给 ESI、ECX 和 EBX。) 现 假设 有 一 数据 定义 如 下 : 


.data 
array DWORD 1000h,2000h,3000h,4000h 


下 面 的 语句 按照 默认 属性 显示 数组 : 


mDumpMem OFFSET array, LENGTHOF array，TYPE array 


输出 为 : 


Dump of offset 00405004 


00001000 00002000 00003000 00004000 
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下 面 的 语句 则 将 同一 个 数组 显示 为 字 节 序列 : 


mDumpMem OFFSET array, SIZEOF array, TYPE BYTE 


输出 为 : 


Dump of offset 00405004 


00 10 00 00 00 20 00 00 00 30 00 00 00 40 00 00 


下 面 的 代码 把 三 个 数值 压 人 堆栈 ， 并 设置 好 EBX、ECX 和 ESI， 然 后 调用 mDumpMem 
显示 堆栈 : 


mov eax, OAAAAAAAAN 

push eax 

mov eax,0BBBBBBBBh 

push eax 

mov eax,0Occcccccch 

push eax 

mov ebx,1 

mov ecx,2 

mov esi,3 

mDumpMem esp, 8, TYPE DWORD 


显示 出 来 的 结果 堆栈 区 域 表 明 ， 宏 已 经 先 把 EBX、ECX 和 ESI 压 人 了 堆栈 。 这 些 数 值 
之 后 是 在 调用 mDumpMem 之 前 人 栈 的 3 个 整数 : 


Dump of offset 0012FFRC 


00000003 00000002 00000001 CCCCCCCC BBBBBBBB AAAAAAAA 7C816D4F 
0000001A 


实现 宏 代 码 清单 如 下 : 


mDumpMem MACRO address:REQ, itemCount:REQ, componentSize:REQ 
; 用 DumpMem 过 程 显示 一 个 内 存 区 域 。 

; 接收 : 内 存 偏 移 量 、 显 示 对 象 的 数量 ， 以 及 每 个 存储 对 象 的 大 小 。 

7 避免 用 EBX、ECX 和 了 SI 传递 实 参 。 


push esi 
mov esi,address 


mov ecx,itemCount 
mov ebx,componentSize 
call DumpMem 


pop esi 
pop ecx 
pop ebx 
ENDM 


2. mDump 

宏 mDump 用 十 六 进 制 显示 一 个 变量 的 地 址 和 内 容 。 传 递 给 它 的 参数 有 : 变量 名 和 
(可 选 的 ) 一 个 字符 以 表明 在 该 变量 之 后 应 显示 的 标号 。 显 示 格 式 自动 与 变量 的 大 小 属性 
(BYTE、WORD 或 DWORD) 匹配 。 下 面 的 例子 展示 了 对 mDump 的 两 次 调用 : 


.data 
diskSize DWORD 12345h 
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.Code 
mDump diskSize ; no label 
mDump diskSize,Yy ; Show label 


代码 执行 后 ， 产 生 的 输出 如 下 所 示 : 


Dump of offset 00405000 


00012345 


Variable name: diskSize 
Dump of offset 00405000 


00012345 


实现 下 面 是 宏 mDump 的 代码 清单 ， 它 反 过 来 又 调用 了 mDumpMem。 代 码 用 一 个 新 


的 伪 指 令 IFNB ( 若 不 为 空 ) 来 发 现 主 调 者 是 否 向 第 二 个 形 参 传递 了 实 参 (参见 10.3 节 ): 


; -~--- 一 -一 -一 一- 一--- 一 -一 ------ 一 -一 -一 ---- 一 一 -一 ~- 一 -一 一 一 一 一 一 -一 一 一 一 


mDump MACRO varName:REQ, useLabel 


7 用 其 已 知 属性 显示 一 个 变量 。 
7 接收 : varName 为 变量 名 。 
; 如 果 useLabel 不 为 室 ， 则 显示 变量 名 。 
call Crlf 
IFNB <useLabel> 
mwrite "Variable name: &varName" 
ENDIF 


mDumpMem OFFSET varName, LENGTHOF varName, TYPE varName 
ENDM 


&varName 中 的 符号 & 是 替换 操作 符 ， 它 允许 将 varName 形 参 的 值 插 入 到 字符 串 文本 


中 。 详 细 内 容 参 见 10.3.7 节 。 


3. mGotoxy 


宏 mGotoxy 把 光标 定位 在 控制 台 窗口 缓冲 区 内 指定 的 行列 上 。 可 以 向 其 传递 8 位 立即 
内 存 操 作 数 和 寄存 器 值 : 


‘ 


mGotoxy 10,20 ; 立即 数 
mGotoxy row,col ; 内 存 操作 数 
mGotoxy ch,cl ; 寄存 器 值 


实现 ”下面 是 宏 的 源 代码 清单 : 


mGotoxy MACRO X:REQ, Y:REQ 


; 设置 光标 在 控制 台 窗口 的 位 置 。 
; 接收 : X 和 Y 坐标 ( 类 型 为 BYTE) 。 避 免 用 DH 和 DL 传递 实 参 。 


call Gotoxy 


pop edx 
ENDM 


避免 寄存 器 冲突 ”车 宏 的 实 参 是 寄存 器 ， 它 们 有 时 可 能 会 与 宏 内 使 用 的 寄存 器 发 生 冲 
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突 。 比 如 ， 调 用 mGotoxy 时 用 了 DH 和 DL， 那么 就 不 会 生成 正确 的 代码 。 为 了 说 明 原 因 ， 
现在 来 查看 上 述 参 数 被 替换 后 展开 的 代码 : 


1 push edx 


2 mov dh,dl ;; 行 
3 mov dl,dh ;; 列 
4 call Gotoxy 

5 pop edx 


假设 DL 传递 的 是 Y 值 ，DH 传递 的 是 X 值 ， 代 码 行 2 会 在 代码 行 3 有 机 会 把 列 值 复制 
到 DL 之 前 就 替换 了 DH 的 原 值 。 


提示 “只 要 有 可 能 ， 宏 定义 应 该 用 注释 说 明 哪些 寄存 器 不 能 用 作 实 参 。 





4. mReadString 


宏 mReadSrting 从 键盘 读 取 一 个 字符 串 ， 并 将 其 存储 在 缓冲 区 。 在 这 个 宏 的 内 部 封装 了 
一 个 对 ReadString 库 过 程 的 调用 。 需 向 其 传递 缓冲 区 名 : 


.data 

firstName BYTE 30 DUP(?) 
.Code 

mReadString firstName 


下 面 是 宏 的 源 代码 : 


mReadString MACRO varName:REQ 


' 
; 从 标准 输入 读 到 缓冲 区 。 
; 接收 : 缓冲 区 名 。 避 免 用 ECX 和 EDX 传递 实 参 。 

push edx 

mov edx,OFFSET varName 

mov ecx,SIZEOF varName 

call ReadString 


pop edx 
pop ecx 
ENDM 
5. mShow 


宏 mShow 按照 主 调 者 选择 的 格式 显示 任何 寄存 器 或 变量 的 名 字 和 内 容 。 传 递 给 它 的 
是 寄存 器 名 ， 其 后 可 选择 性 地 加 上 一 个 字母 序列 ， 以 表明 期 望 的 格式 。 字 母 选 择 如 下 : H= 
十 六 进 制 ，D= 无 符号 十 进 制 ，I= 有 符号 十 进 制 ，B= 二 进 制 ，N= 换行 。 可 以 组 合 多 种 输出 
格式 ， 还 可 以 指定 多 个 换行 。 默 认 格式 为 “HIN”。mShow 是 一 种 有 用 的 辅助 调试 工具 ， 经 
常 被 DumpRegs 库 过 程 使 用 。 可 以 把 mShow 当 作 调 试 工 具 ， 显 示 重 要 寄存 器 或 变量 的 值 。 

示例 ”下面 的 语句 将 AX 寄存 器 的 值 显示 为 十 六 进 制 、 有 符号 十 进 制 、 无 符号 十 进 制 和 
二 进 制 


mov ax,4096 


mShow AX ;? 默认 选项 : HIN 
mShow AX,DBN ; 无 符号 十 进 制 ， 二 进 制 ， 换 行 
输出 如 下 : 


AX = 1000h -4096d 
AX = 4096d 0001 0000 0000 0000b 


[415| 
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示例 下 面 的 语句 在 同一 行 上 ， 用 无 符号 十 进 制 格式 显示 AX，BX，CX 和 DX: 
; 插入 测试 数值 ， 显 示 4 个 寄存 器 : 


mov ax,l 
mov oh 
mov CX,3 
mov dx,4 


mShow AX,D 
mShow BX,D 
mShow CX,D 
mShow DX,DN 


相应 输出 如 下 : 


RX = 1d BX = 2d cx = 3d Dx = 4d 


示例 下 面 的 代码 调用 mShow， 用 无 符号 十 进 制 格式 显示 mydword 的 内 容 ， 并 换行 : 
.data 

mydword DWORD ? 

-code 

mShow mydword,DN 


实现 mShow 的 实现 代码 太 长 不 便 在 这 里 给 出 ,不 过 可 以 在 本 书 安装 文件 夹 (C: 


\Irvine) 内 的 Macros.inc 文件 中 找到 完整 代码 。 在 编写 mShow 时 ， 需 要 注意 在 寄存 器 被 宏 
自身 的 内 部 语句 修改 之 前 显示 其 当前 值 。 


6. mShowRegister 
宏 mShowRegister 显示 单个 32 位 寄存 器 的 名 称 ， 并 用 十 六 进 制 格式 显示 其 内 容 。 传 递 


它 的 是 希望 被 显示 的 寄存 器 名 ， 其 后 紧 跟 寄存 器 本 身 。 下 面 的 宏 调 用 指定 了 被 显示 的 名 称 
为 EBX: 


mShowRegister EBX, ebx 


产生 的 输出 如 下 : 

EBX=7FFD9000 

下 面 的 调用 使 用 尖 括 号 把 标号 括 起 来 ， 其 原因 是 标号 内 有 一 个 空格 : 
mShowRegister <Stack Pointer>, esp 

产生 输出 如 下 : 

Stack Pointer=0012FFC0 


实现 宏 的 源 代码 如 下 : 


mShowRegister MACRO regName, regValue 
LOCAL tempSstr 


; 显示 寄存 器 名 和 内 容 。 
; 接收 ; 寄存 器 名 ， 寄 存 器 什 


.data 
tempStr BYTE " &regName=",0 
.code 
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push eax 


; 显示 寄存 器 名 
push edx 
mov edx,OFFSET tempSstr 
call Writestring 
pop edx 
;显示 寄存 器 内 容 
mov eax,regValue 
call WriteHex 
pop eax 
ENDM 


7. mWriteSpace 

宏 mWriteSpace 向 控制 台 窗 口 输出 一 个 或 多 个 空格 。 可 以 选择 性 地 向 其 传递 一 个 整数 形 
以 指定 空格 数 (默认 为 一 个 )。 例 如 ， 下 面 的 语句 写 了 5 个 空格 : 

mwriteSpace 5 


实现 mWriteSpace 的 源 代码 如 下 : 


mWriteSpace MACRO count:=<1> 


2 


;向 控制 台 窗 口 输出 一 个 或 多 个 空格 。 
; 接收 : 一 个 整数 以 指定 空格 数 。 
; 默认 个 数 为 1。 


LOCRL spaces 
.data 
spaces BYTE count DUP(' '),0 
.code 
Push edx 
mov edx,OFFSET spaces 
call Writestring 
pop edx 
ENDM 


10.3.2 节 说 明了 如 何 使 用 宏 形 参 的 默认 初始 值 。 

8. mWriteString 

宏 mWriteSrting 向 控制 台 窗 口 输出 一 个 字符 串 变量 的 内 容 。 从 宏 的 内 部 来 看 ， 它 通过 
在 同一 语句 行 上 传递 字符 串 变量 名 简化 了 对 WriteString 的 调用 。 例 如 : 

en A "Please enter your name: ",0 


.code 
mWwritestring strl 


实现 mWriteString 的 实现 如 下 ， 它 将 EDX 保存 到 堆栈 ， 然 后 把 字符 串 偏 移 量 赋 给 
EDX， 在 过 程 调用 后 ， 再 从 堆栈 恢复 EDX 的 值 : 


mWriteString MACRO buffer:REQ 


; 向 标准 输出 写 一 个 字符 串 变 量 。 
; 接收: 字符 串 变量 名 。 


push edx 
mov edx,OFFSET buffer 
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call WriteString 
pop edx 
ENDM 


10.2.6 示例 程序 封装 器 


现在 创建 一 个 简短 的 程序 Wraps.asm 来 展示 之 前 已 介绍 的 作为 过 程 封装 器 的 宏 。 由 于 
每 个 宏 都 隐 含 了 大 量 繁琐 的 参数 传递 ， 因 此 程序 出 奇 得 紧凑 。 假 设 这 里 所 有 的 宏 当 前 都 在 
Macros.inc 文件 内 : 


; 过 程 封 装 器 宏 (Wraps .asm) 

;? 本 程序 演示 宏 作为 库 过 程 的 封装 器 。 

; 内 容 : mGotoxy、mWrite、mWritestring、 mReadString 和 mDumpMem。 
INCLUDE Irvine32.inc 

INCLUDE Macros.inc ; 宏 定义 


.data 

array DWORD 1,2,3,4,5,6,7,8 
firstName BYTE 31 DUP(?) 
lastName BYTE 31 DUP(?) 


.Code 
main PROC 
mGotoxy 0,0 
mWrite <"Sample Macro Program",0dh,0ah> 
7 输入 用 户 名 。 
mGotoxy 0,5 
mWrite "Please enter your first name: " 
ImReadString firstName 
CAL1 CELE 


mWrite "Please enter your last name: " 
mReadString lastName 
Gall CrlE 
;显示 用 户 名 。 
mWwrite "Your name is " 
mWritestring firstName 
mWriteSpace 
mwriteSstring lastName 
CALL CElE 
;显示 整数 数组 。 
mDumpMem OFFSET array, LENGTHOF array, ‘ 
exit 
main ENDP 
END main 


程序 输出 ”程序 输出 的 示例 如 下 : 


Sample Macro Program 

Please enter your first name: Joe 
Please enter your last name: Smith 
Your name is Joe Smith 


Dump of offset 00404000 


00000001 00000002 00000003 00000004 00000005 
00000006 00000007 00000008 
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10.2.7 本 节 回 顾 


1. ( 真 / 假 ): 当 一 个 宏 被 调用 时 ，CALL 和 RET 指令 将 自动 插入 到 汇编 程序 中 。 

2.( 真 / 假 ): 宏 展开 由 汇编 器 的 预 处 理 程序 控制 。 

3. 与 不 使 用 参数 的 宏 相 比 ， 使 用 参数 的 宏 有 哪些 主要 优势 ? 

4.( 真 / 假 ) : 只 要 宏 定 义 在 代码 段 中 ， 它 就 既 能 出 现在 宏 调用 语句 之 前 ， 也 能 出 现在 宏 调 用 
语句 之 后 。 

5.( 真 / 假 ): 对 一 个 长 过 程 而 言 ， 若 用 包含 这 个 过 程 代码 的 宏 来 代替 它 ， 则 多 次 调用 该 宏 通 
常 就 会 增加 程序 的 编译 代码 量 。 

6.( 真 / 假 ): 宏 不 能 包含 数据 定义 。 


10.3 条件 汇编 伪 指 令 


很 多 不 同 的 条 件 汇编 伪 指 令 都 可 以 和 宏一 起 使 用 ， 这 使 得 宏 更 加 灵活 。 条 件 汇编 伪 指 令 
常用 语法 如 下 所 示 : 


IF condition 
statements 
[ELSE 
statements] 
ENDIF 


提示 “本章 给 出 的 常量 伪 指 令 不 应 与 6.7 节 介绍 的 运行 时 伪 指 令 混 消 ， 如 .IF 





和 .ENDIF 等 。 后 者 按照 运行 时 的 寄存 器 与 变量 值 来 计算 表达 式 。 


表 10-3 列 出 了 更 多 常用 的 条 件 汇 编 伪 指令 。 若 说 明 为 该 伪 指令 允许 汇编 ， 就 意味 着 所 
有 的 后 续 语 句 都 将 被 汇编 ， 直 到 遇 到 下 一 个 ELSE 或 ENDIF 伪 指 令 。 必 须 强 调 的 是 ， 表 中 
列 出 的 伪 指 令 是 在 汇编 时 而 不 是 运行 时 计算 。 
表 10-3 条 件 汇 编 伪 指 令 


伪 指 令 说 明 
IF expression 若 expression 为 真 ( 非 零 ) 则 允许 汇编 。 可 能 的 关系 运算 符 为 LT、GT、EQ、NE、LE 和 GE 
IFB<argument> 车 argument 为 空 则 允许 汇编 。 实 参 名 必须 用 尖 括 号 (二 ) 括 起 来 


IFNB<argument> 车 argument 为 非 空 则 允许 汇编 。 实 参 名 必须 用 尖 括 号 (二 ) 括 起 来 
IFIDN<arg1>,<arg2> | 若 两 个 实 参 相等 (相同 ) 则 允许 汇编 。 采 用 区 分 大 小 写 的 比较 
IFIDNI<arg1>,<arg2> | 若 两 个 实 参 相等 (相同 ) 则 允许 汇编 。 采 用 不 区 分 大 小 写 的 比较 
IFDIF<arg1>,<arg2> | 若 两 个 实 参 不 相等 则 允许 汇编 。 采 用 区 分 大 小 写 的 比较 
IFDIFI<arg1>,<arg2> | 若 两 个 实 参 不 相等 则 允许 汇编 。 采 用 不 区 分 大 小 写 的 比较 


IFDIF name 车 name 已 定义 则 允许 汇编 

IFNDEF name 车 name 还 未 定义 则 允许 汇编 

ENDIF 结束 用 一 个 条 件 汇编 伪 指 令 开始 的 代码 块 

ELSE 若 条 件 为 真 ， 则 终止 汇编 之 前 的 语句 。 车 条 件 为 假 ，ELSE 汇编 语句 直到 遇 到 下 一 个 ENDIF 
ELSEIF expression 车 之 前 条 件 伪 指令 指定 的 条 件 为 假 ， 而 当前 表达 式 为 真 ， 则 汇编 全 部 语句 直到 出 现 ENDIF 
EXITM 立即 退出 宏 ， 阻止 所 有 后 续 宏 语句 的 展开 


10.3.1 检查 缺失 的 参数 
宏 能 够 检查 其 参数 是 否 为 空 。 通 常 ， 宏 若 接收 到 空 参数 ， 则 预 处 理 程序 在 进行 宏 展开 时 
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会 导致 出 现 无 效 指令 。 例 如 ， 如 果 调 用 宏 mWrtieString 却 又 不 传递 实 参 ， 那么 宏 展 开 在 把 
字符 串 偏 移 量 传递 给 EDX 时 ， 就 会 出 现 无 效 指令 。 汇 编 器 生成 的 如 下 语句 检测 出 缺失 的 操 
作 数 ， 并 产生 了 一 个 错误 消息 : 


mWriteString 

二 Push edx 

1 mov edx,OFFSET 

Macro2.asm(18) : error A2081: missing operand after unary operator 
下 call WriteString 

a pop edx 


为 了 防止 由 于 操作 数 缺 失 而 导 致 的 错误 ， 可 以 使 用 IFB (if blank) 伪 指 令 ， 若 宏 实 参 为 
空 ， 则 该 伪 指 令 返 回 值 为 真 。 还 可 以 使 用 IFNB (if not blank) 运算 符 ， 若 宏 实 参 不 为 空 ， 则 
其 返回 值 为 真 。 现 在 编写 mWrtieString 的 男 一 个 版 本 ,使 其 可 以 在 汇编 时 显示 错误 消息 : 


mwritestring MACRO string 
IFB <string> 
ECHO --------------~----—-—-------------~--------- 
ECHO * Error: parameter missing in mWritestring 
ECHO * (no code generated) 


push edx 
mov edx,OFFSET string 
call WriteString 
pop edx 
ENDM 
(回忆 一 下 10.2.2 节 ， 程 序 汇编 时 ，ECHO 伪 指 令 向 控制 台 写 一 个 消息 。) EXITM 伪 指 
令 告 诉 预 处 理 程序 退出 宏 ， 不 再 展开 更 多 宏 语句 。 汇 编 的 程序 有 缺失 参数 时 ， 其 屏幕 输出 如 
下 所 示 : 


Assembling: Macro2.asm 


Error: Parameter missing in mWwriteString 


(no code generated) 





10.3.2 ”默认 参数 初始 值 设 定 


宏 可 以 有 默认 参数 初始 值 。 如 果 调 用 宏 出 现 了 宏 参 数 缺 失 ， 那 么 就 可 以 使 用 默认 参数 。 
其 语法 如 下 : 


paramname := < argument > 


(运算 符 前 后 的 空格 是 可 选 的 ,) 比如 ， 宏 mWriteln 提供 含有 一 个 空格 的 字符 串 作为 其 默 
认 参 数 。 如 果 对 其 进行 无 参数 调用 ， 它 仍然 会 打印 一 个 空格 并 换行 : 


mWwriteln MACRO text:=<" "> 
mWrite text 
CaEl CELE 

ENDM 


车 把 空 字 符 串 ("") 作为 默认 参数 ， 那 么 汇编 器 会 产生 错误 ， 因 此 必须 在 引号 之 间 至 少 
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插入 一 个 空格 。 


10.3.3 


布尔 表达 式 


汇编 器 允许 在 包含 IF 和 其 他 条 件 伪 指 令 的 常量 布尔 表达 式 中 使 用 下 列 关 系 运 算 符 : 


LT 


GE 


10.3.4 


小 于 
大 于 
等 于 
不 等 于 
小 于 等 于 
大 于 等 于 


IF、ELSE 和 ENDIF 伪 指 令 


IF 伪 指 令 的 后 面 必 须 跟 一 个 常量 布尔 表达 式 。 该 表达 式 可 以 包含 整数 常量 、 符 号 常量 
或 者 常量 宏 实 参 ， 但 不 能 包含 寄存 器 或 变量 名 。 仅 适用 于 IF 和 ENDIF 的 语法 格式 如 下 : 


IF expression 


statement-list 


ENDIF 


另 一 种 格式 则 适用 于 IF、ELSE 和 ENDIF : 


IF expression 


ELSE 


statement-list 


statement-list 


ENDIF 


示例 : 宏 mGotoxyConst 宏 mGotoxyConst 利用 LT 和 GT 运算 符 对 传递 给 宏 的 参数 
进行 范围 检查 。 实 参 X 和 YY 必须 为 常数 。 还 有 一 个 常数 符号 ERRS 对 发 现 的 错误 进行 计数 。 
根据 X 的 值 ， 可 以 将 ERRS 设置 为 1。 根据 Y 的 值 ， 可 以 将 ERRS 加 1。 最 后 ， 如 果 ERRS 
大 于 零 ，EXITM 伪 指 令 退 出 宏 : 


mGotoxyConst MACRO X:REQ, Y:REQ 


; 将 光标 位 置 设置 在 xX 列 Y 行 。 
; 要 求 X 和 Y 的 坐标 为 常量 表达 式 
; 其 范围 为 0 入 X<80，0 二 Y<25。 


LOCAL ERRS ;; 局 部 常量 
ERRS = 0 
TPR (X LT 0) OR (X GT 799 
ECHO Warning: First argument to mGotoxy (X) is out of range. 
ECHO 实 实 关内 次 容 实 次 灾 交 光 灾 实 次 次 实 实 灾 突 交 交 六 容 实 次 突 容 灾 灾 实 交 内 容 灾 灾 交 六 容 灾 灾 祥 次 祷 灾 灾 灾 次 灾 交 灾 祥 灾 灾 六 
ERRS = 1 
ENDIF [423 
IF (Y LT 0) OR (Y GT 24) 
ECHO Warning: Second argument to mGotoxy (Y) is out of range. 
ECHO 下 南 去 去 责 去 二 友 去 下 炎 去 去 大 去 矶 类 二 去 妈 灾 友 克 克 业 女 娄 去 去 去 二 去 大 训 闪 去 文 走 去 去 闪 责 去 去 坟 太 类 定 坟 如 炎 二 次 业 
ERRS = ERRS + 1 
ENDIF 


IF ERRS GT 0 ;; 若 发 现 错误 ， 
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EXITM ;7 退出 宏 

ENDIF 

push edx 

mov dh,Y 

mov dl,x 

call Gotoxy 

pop edx 

ENDM 


10.3.5 IFIDN 和 1FIDNI 伪 指令 


IFIDNI 人 擅 指 令 在 两 个 符号 (包括 宏 参 数 名 ) 之 间 进 行 不 区 分 大 小 写 的 比较 ， 如 果 它 们 相 
等 ， 则 返回 真 。IFIDN 伪 指 令 执 行 的 是 区 分 大 小 写 的 比较 。 如 果 想 要 确认 宏 主 调 者 使 用 的 寄 
存 器 参数 不 会 与 宏 内 使 用 的 寄存 器 发 生 冲 突 ， 那 么 可 以 使 用 这 两 个 伪 指 令 中 的 前 者 。IFIDNI 
的 语法 如 下 : 

IFIDNI <symbol>, <symbol> 


statements 
ENDIF 


IFIDN 的 语法 与 之 相同 。 例 如 下 面 的 宏 mReadBuf， 其 第 二 个 参数 不 能 用 EDX， 因 为 当 
buffer 的 偏 移 量 被 送 入 EDX 时， 原来 的 值 就 会 被 覆盖 。 在 如 下 修改 过 的 宏 代码 中 ， 如 果 这 
个 条 件 不 满足 ， 就 会 显示 一 条 警告 消息 : 


mReadBuf MACRO bufferPtr, maxChars 


; 将 键盘 输入 读 到 缓冲 区 。 
; 接收 : 缓冲 区 偏 移 量 ， 最 多 可 输入 字符 的 数量 。 第 二 个 参数 不 能 用 edx 或 EDX。 


IFIDNI <maxChars>,<EDX> 
ECHO Warning: Second argument to mReadBuf cannot be EDX 
ECHO 帘 交 次 突 次 六 太 容 灾害 出 六 次 六 突 六 六 六 灾 诊 交 奖 六 六 六 六 六 商 关山 交 次 关头 关 灾 闪闪 次 次 次 次 灾 六 次 育 六 六 太 内 
EXITM 

ENDIF 

push ecx 

push edx 

mov edx,bufferPptr 

mov ecx,maxChars 

call ReadString 

pop edx 

pop ecx 

ENDM 


下 面 的 语句 将 会 导致 宏 产生 警告 消息 ,因为 EDX 是 其 第 二 个 参数 : 


mReadBuf OFFSET buffer,edx 


10.3.6 示例 : 矩阵 行 求 和 


9.4.2 节 展 示 了 如 何 计算 字 节 和 矩阵 中 单个 行 的 总 和 。 第 9 章 编程 练习 要 求 将 其 扩展 到 字 
矩阵 和 双 字 和 矩阵。 尽管 这 个 解决 方案 有 些 宛 长 ， 现 在 还 是 要 看 看 能 否 用 宏 来 简化 任务 。 首 
先 ， 给 出 第 9 章 的 原始 calc_row_sum 过 程 : 


calc_row_sum PROC USES ebx ecx esi 
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; 计算 字 节 矩阵 中 一 行 的 总 和 。 
; 接收 : EBX= 表格 偏 移 量 ，EAX= 行 索引 ，ECX= 按 字 节 计 的 行 大 小 。 


mul ecx ; 行 索 引 x 行 大 小 
add ebx,eax ; 行 偏 移 量 
mov eax,0 ; 累加 器 
mov esi,0 ; 列 索引 

Ll: movzx edx,BYTE PTR[ebx + esil] ; 取 一 个 字 节 
add eax,edx ; 与 累加 器 相 加 
inc esi ; 行内 的 下 一 个 字 节 
loop Ll 
ret 


calc_row_ sum ENDP 


从 把 PROC 改 为 MACRO 开始 ， 删 除 RET 指令 ， 把 ENDP 改 为 ENDM。 由 于 没有 宏 与 
USES 伪 指 令 功能 相当 ， 因 此 插入 PUSH 和 了 POP 指令 : 
mCalc_row sum MACRO 
push ebx ; 保存 被 修改 的 寄存 器 


push ecx 
push esi 


ml ecx ; 行 索引 xX 行 大 小 
add ebx,eax ; 行 偏 移 量 
mov eax,0 ; 累加 器 
mov esi,0 ; 列 索 引 

L1: movzx edx,BYTE PTR[ebx + esi] 
add eax,edx ; 取 一 个 字 节 
inc esi ? 与 累加 器 相 加 
loop L1 ; 行内 的 下 一 个 字 节 
pop esi ; 恢复 被 修改 的 寄存 器 
pop ecx 
pop ebx 


ENDM 


接着 ， 用 宏 参 数 代替 寄存 器 参数 ， 并 对 宏 内 寄存 器 进行 初始 化 : 
mCalc row_ sum MACRO index, arrayOffset, rowSize 
push ebx ; 保存 被 修改 的 寄存 器 
push ecx 
push esi 


; 设置 需要 的 寄存 器 
mov eax,index 
mov ebx,arrayOffset 
mov ecx,rowSize 


mul ecx ; 行 索引 x 行 大 小 
add ebx,eax ; 行 偏 移 量 
mov eax,0 ; 累加 器 
mov esi,0 ; 列 索 引 

L1: movzx edx,BYTE PTR[ebx + esi] ;7 取 一 个 字 节 
add eax,edx ; 与 累加 器 相 加 
inc esi ; 行内 的 下 一 个 字 节 
loop Ll 
pop esi ; 恢复 被 修改 的 寄存 器 
pop ecx 
pop ebx 


ENDM 
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然后 ， 添 加 一 个 参数 eltType 指定 数组 类 型 (BYTE、WORD 或 DWORD); 


mCalc_row_ sum MACRO index, arrayOffset, rowSize, eltType 


复制 到 ECX 的 参数 rowSize 现在 表示 的 是 每 行 的 字 节 数 。 如 果 要 用 其 作为 循环 计数 器 ， 
那么 它 就 必须 转换 为 每 行 的 元 素 (element) 个 数 。 因 此 ， 若 为 16 位 数组 ， 就 将 ECX 除 以 
2 ; 若 为 双 字数 组 ， 就 将 ECX 除 以 4。 实现 上 述 操作 的 快捷 方式 为 : eltType 除 以 2， 把 商 作 
为 移 位 计数 器 ， 再 将 ECX 右 移 : 


shr ecx, (TYPE eltType / 2) ; byte=0, word=1, dword=2 


TYPE eltType 就 成 为 MOVZX 指令 中 基 址 - 变 址 操作 数 的 比例 因子 : 


movzx edx,eltType PTR[ebx + esi*(TYPE eltType)] 


若 MOVZX 右 操 作 数 为 双 字 ， 那 么 指令 不 会 汇编 。 所 以 ， 当 eltType 为 DWORD 时 , 需 
要 用 IFIDNI 运算 符 另 外 编写 一 条 MOY 指令 ; 


IFIDNI <eltType>,<DWORD> 

mov edx,eltType PTR[ebx + esi*(TYPE eltType)] 
ELSE 

movzx edx,eltType PTRfebx + esi*(TYPE eltType)] 
ENDIF 


最 后 必须 结束 宏 ， 记 住 要 把 标号 L1 指定 为 LOCAL: 


mCalc row sum MACRO index, arrayOffset, rowSize, eltType 


; 计算 二 维 数组 中 一 行 的 和 数 。 


; 接收 : 行 索引 、 数 组 偏 移 量 、 每 行 的 字 节 数 、 数 组 类 型 (BYTE、WORD、 或 DWORD) 。 
; 返回 : EAX= 和 数 。 
DER TL 

push ebx ; 保存 被 修改 的 寄存 器 

push ecx 

push esi 


; 设置 需要 的 寄存 器 
mov ”eax,indqex 
mov ebx,arrayOffset 
mov ecx,rowSize 


; 计算 行 偏 移 量 
mul ecx ; 行 索引 X 行 大 小 
add ebx,eax ; 行 偏 移 量 
; 初始 化 循环 计数 器 
shr ecx, (TYPE eltType / 2) ; byte=0, word=]1, dword=2 
; 初始 化 累加 器 和 列 索 引 
mov eax,0 ; 累加 器 
mov esi,0 ; 列 索引 
Ll: 


IFIDNI <eltType>, <DWORD> 

mov edx,eltType PTR[ebx + esi*(TYPE eltType)] 
ELSE 

movzx edx,eltType PTR[ebx + esi*(TYPE eltType)] 
ENDIF 
add eax,edx ;? 与 累加 器 相 加 
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loop Ll 
pop esi ; 恢复 被 修改 的 寄存 器 
pop ecx 
pop ebx 
ENDM 
下 面 用 字 节 数组 、 字 数组 和 双 字 数组 对 宏 进行 示例 调用 。 参 见 rowsum.asm 程序 : 
.data 
tableB BYTE 10h， 20h, 30h, 40h, 50h 
RowSizeB = ($ - tableB) 


BYTE 60h, 70h, 80h, 90h, 0a0h 


BYTE 0BOh, OCOh, ODOh, 0E0h, OFOh 
tablew WORD 10h， 20h, 30h, 40h, 50h 


RowSizeW = ($ - tablew) 
WORD 60h, 70h, 80h, 90h, Oa0h 
WORD 0BOh, 0COh, ODOh, 0E0h, OFOh 


tableD DWORD 10h, 20h, 30h, 40h, 50h 
RowSizeD = ($ - tableD) 
DWORD 60h， 70h, 80h, 90h， 0RAoh 
DWORD 0B0h，0Ccoh，0D0h，0E0h，0F0h 


index DWORD ? 

.Code 

mCalc row sum index, OFFSET tableB, RowSizeB, BYTE 
mCalc row sum index, OFFSET tableW, RowSizeW, WORD 
mCalc row sum index, OFFSET tableD, RowSizeD, DWORD 


10.3.7 ”特殊 运算 符 
下 述 四 个 汇编 运算 符 使 得 宏 更 加 灵活 : 


文字 文本 运算 符 


文字 字符 运算 符 





1. 替换 运算 符 (&) 
替换 运算 符 (人 有) 解析 对 宏 参数 名 的 有 歧义 的 引用 。 宏 mShowRegister ( 10.2.5 节 ) 显示 
了 一 个 32 位 寄存 器 的 名 称 和 十 六 进 制 的 内 容 。 示 例 调用 如 下 : 


.Code 
mShowRegister ECX 


下 面 是 调用 mShowRegister 产生 的 示例 输出 : 


在 宏 内 可 以 定义 包含 寄存 器 名 的 字符 串 变 量 : 


mShowRegister MACRO regName 

-data 

tempStr BYTE " regName=",0 

但 是 预 处 理 程序 会 认为 regName 是 字符 串 文 本 的 一 部 分 ， 因 此 ， 不 会 将 其 蔡 换 为 传递 
给 宏 的 实 参 值 。 相 反 ， 如 果 添 加 了 & 运算 符 ， 它 就 会 强制 预 处 理 程 序 在 字符 串 文 本 中 插入 
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宏 实 参 (如 ECX)。 下 面 展示 的 是 如 何 定义 tempStr: 


mShowRegister MACRO regName 
.data 
tempSstr BYTE " &regName=",0 


2. 展开 运算 符 (% ) 

展开 运算 符 〈%) 展开 文本 宏 并 将 常量 表达 式 转换 为 文本 形式 。 有 几 种 方法 实现 该 功能 。 
若 使 用 的 是 TEXTEQU ，% 运算 符 就 计算 常量 表达 式 ， 再 把 结果 转换 为 整数 。 在 下 面 的 例子 
中 ，% 运算 符 计 算 表 达 式 ( 5S+count)， 并 返回 整数 15 (以 文本 形式 ): 

rte gs(5 + count) 7 = “15" 

如 果 宏 请 求 的 实 参 是 整数 常量 ,% 运算 符 就 能 使 程序 具有 传递 一 个 整数 表达 式 的 灵活 性 。 
计算 这 个 表达 式 得 到 结果 值 ， 然 后 将 这 个 值 传递 给 宏 。 例 如 ,调用 mGotoxyConst 时 ， 计算 
表达 式 的 结果 分 别 为 50 和 7: 


mGotoxyConst ®%(5 * 10), %(3 + 4) 


预 处 理 程序 将 产生 如 下 语句 : 
水 push edx 

1 mov dh,7 

mov dl,50 

部 call Gotoxy 

L pop edx 


% 在 一 行 的 首位 ” 当 展 开 运 算 符 (%) 是 一 行 源 代码 的 第 一 个 字符 时 ， 它 指示 预 处 理 程 
序 展开 该 行 上 的 所 有 文本 宏和 宏 函 数 。 比 如 ， 假 设想 在 汇编 时 将 数组 大 小 显示 在 屏幕 上 。 下 
面 的 尝试 不 会 产生 期 望 的 结果 : 


.data 

array DWORD 1,2,3,4,5,6,7,8 

.Code 

ECHO The array contains (SIZEOF array) bytes 
ECHO The array contains %(SIZEOF array) bytes 


屏幕 输出 没什么 用 : 
The array contains (SIZEOF array) bytes 
The array Contains %(SIZEOF array) bytes 


反之 ， 如 果 用 TEXTEQU 编写 包含 (SIZEOF array) 的 文本 宏 ， 那 么 该 宏 就 可 以 展开 为 
之 后 的 代码 行 : 


TempStr TEXTEQU %(SIZEOF array) 
% ECHO The array contains TempStr bytes 


产生 的 输出 如 下 所 示 : 


显示 行 号 下 面 的 宏 Mul32 将 它 前 两 个 实 参 相 乘 ,乘积 由 第 三 个 实 参 返回 。 其 形 参 可 
以 是 寄存 器 、 内 存 操作 数 和 立即 数 (乘积 除外 ): 


Mul32 MACRO opl, op2, product 
IFIDNI <op2>,<EAX> 
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ECHO —-—--- 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
ECHO * Error on line LINENUM: EAX cannot be the second 
ECHO * argument when invoking the MUL32 macro. 

ECHO ------- 一 一 一 -一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一- 一 一 一 一 一 一 


op 


mov product,eax 
pop eax 
ENDM 


Mul32 要 检查 的 一 个 重要 要 求 是 : EAX 不 能 作为 第 二 个 实 参 。 这 个 宏 有 趣 的 地 方 是 ， 
它 显示 的 是 其 调用 者 的 行 号 ， 这 样 更 加 易于 追踪 并 解决 问题 。 首 先 定义 文本 宏 LINENUM， 
它 引 用 的 @LINE 是 一 个 预先 定义 的 汇编 运算 符 ， 其 功能 为 返回 当前 源 代码 行 的 编号 : 


LINENUM TEXTEQU $ (8@LINE) 


接着 ， 在 含有 ECHO 语句 的 代码 行 第 一 列 上 的 展开 运算 符 (%) 使 得 LINENUM 被 
展开 : 


多 ECHO * Error on line LINENUM: EAX cannot be the second 


假设 如 下 宏 调 用 发 生 在 程序 的 40 行 : 


MUL32 vall,eax,val3 


那么 ， 汇 编 时 将 显示 如 下 信息 : 


* Error on line 40: EAX cannot be the second 


* argument when invoking the MUL32 macro. 





在 Macro3.asm 程序 中 可 以 查看 Mul32 的 测试 。 
3. 文字 文本 运算 符 (<>) 
文字 文本 (literal-text) 运算 符 (二 ) 把 一 个 或 多 个 字符 和 符号 组 合成 一 个 文字 文本 ， 以 
防止 预 处 理 程序 把 列表 中 的 成 员 解释 为 独立 的 参数 。 在 字符 串 含有 特殊 字符 时 该 运算 符 非 常 
有 用 ， 比 如 逗号 、 百 分 号 (%)、 和 号 ( 久 ) 以 及 分 号 ( ; )， 这 些 符号 既 可 以 被 解释 为 分 隔 符 ， 
又 可 以 被 解释 为 其 他 的 运算 符 。 例 如 ， 本 章 之 前 给 出 的 宏 mWrite 接收 一 个 字符 串 文本 作为 [430 
其 唯一 的 实 参 。 如 果 传 递 的 字符 串 如 下 所 示 ， 预 处 理 程序 就 会 将 其 解释 为 3 个 独立 的 实 参 : 


mWwrite "Line three", 0dh, 0ah 

第 一 个 逗号 后 面 的 文本 会 被 丢弃 ， 因 为 宏 只 需要 一 个 实 参 。 然 而 ， 如 果 用 文字 文本 运算 
符 将 字符 串 括 起 来 ,那么 预 处 理 程序 就 会 把 尖 插 号 内 所 有 的 文本 当 作 一 个 宏 实 参 : 

mWrite <"Line three", 0dh, 0ah> 


4. 文字 字符 运算 符 ( ! ) 
构造 文字 字符 ( literal-character) 运算 符 (1 ) 的 目的 与 文字 文本 运算 符 的 几乎 完全 一 
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样 : 强制 预 处 理 程序 把 预先 定义 的 运算 符 当 作 普 通 的 字符 。 在 下 面 的 TEXTEQU 定义 中 ,， 运 
算 符 ! 可 以 防止 符号 > 被 当 作 文本 分 隔 符 : 


BadYValue TEXTEQU <Warning: Y-coordinate is !> 24> 


警告 信息 示例 下 面 的 例子 有 助 于 说 明 运算 符 %、& 和 ! 是 如 何 工作 的 。 假 设 已 经 定义 
了 符号 BadYValue。 现 在 创建 一 个 宏 ShowWarning， 接 收 一 个 用 引号 括 起 来 的 文本 实 参 ， 并 
将 其 传递 给 宏 mWrite。 注 意 蔡 换 (&) 运算 符 的 用 法 : 


ShowWarning MACRO message 
mWrite "gmessage” 
ENDM 
然后 调用 ShowWarning， 把 表达 式 %BadYValue 传递 给 它 。% 运 算 符 计算 (解析 ) 
BadYValue， 并 生成 与 之 等 价 的 字符 串 : 


.code 
ShowWarning ®%BadYValue 


正如 所 期 望 的 ， 程序 运 行 并 显示 警告 信息 : 


10.3.8 宏 函 数 


宏 函 数 与 宏 过 程 有 相似 的 地 方 ， 它 也 为 汇编 语言 语句 列表 分 配 一 个 名 称 。 不 同 的 地 方 在 
于 ， 宏 函数 通过 EXITM 伪 指 令 总 是 返回 一 个 常量 (整数 或 字符 串 )。 如 下 例 所 示 ， 如 果 给 定 
符号 已 定义 ， 则 宏 IsDefined 返回 真 (-1 ); 否则 返回 假 (0): 


IsDefined MACRO Symbol 
IFDEF symbol 
EXITM <-1> 
ELSE 
EXITM <0> 
ENDIF 
ENDM 


EXITM (退出 宏 ) 伪 指 令 终止 了 所 有 后 续 的 宏 展开 。 
调用 宏 函 数 调用 宏 函 数 时 ， 它 的 实 参 列表 必须 用 括号 括 起 来 。 比 如 ， 调 用 宏 
IsDefined 并 传递 RealMode (一 个 可 能 已 定义 也 可 能 还 未 定义 的 符号 名 ): 


IF IsDefined( RealMode ) 
mov ax,@data 
mov ds,ax 

ENDIF 


如 果 在 汇编 过 程 中 ， 汇 编 器 在 此 之 前 已 经 遇 到 过 对 RealMode 的 定义 ， 那 么 它 就 会 汇编 
这 两 条 指令 : 


mov axvadata 
mov ds,ax 


同样 的 下 伪 指 令 可 以 被 放 在 名 为 Startup 的 宏 内 : 


Startup MACRO 
IF IsDefined( RealMode ) 
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mov ax,&data 
mov ds,ax 
ENDIF 
ENDM 


像 IsDefined 这 样 的 宏 可 以 用 于 设计 多 种 内 存 模式 的 程序 。 比 如 ， 可 以 用 它 来 决定 使 用 
哪 种 头 文件 : 
IF IsDefined( RealMode ) 
INCLUDE Irvinelé.inc 
ELSE 


INCLUDE Irvine32.inc 
ENDIF 


定义 RealMode 符号 剩 下 的 任务 就 只 是 找到 定义 RealMode 符号 的 方法 。 方 法 之 一 是 
把 下 面 的 代码 行 放 在 程序 开始 的 位 置 : 


RealMode = 1 


或 者 ， 汇 编 器 命令 行 也 有 选项 来 定义 符号 ， 即 ， 使 用 -D。 下 面 的 ML 命令 行 定义 了 
RealMode 符号 并 为 其 赋值 1: 


ML -c -DRealMode=1 myProg.asm 


而 保护 模式 程序 中 相应 的 ML 命令 就 没有 定义 RealMode 符号 : 


ML -C myProg.asm 


HelloNew 程序 下 面 的 程序 (HelloNew.asm) 使 用 刚才 介绍 的 宏 ， 在 屏幕 上 显示 了 一 
条 消 申 : 


; 宏 函 数 (HelloNew.asm) 
INCLUDE Macros.inc 
IF IsDefined( RealMode ) 
INCLUDE Irvinel6.inc 
ELSE 
INCLUDE Irvine32.inc 
ENDIF 


.Code 

main PROC 
Startup 
mWrite <"This program can be assembled to run ",0dh,0ah> 
mWrite <"in both Real mode and Protected mode.",0dh,0ah> 
exit 

main ENDP 

END main 


第 14 ~ 17 章 介绍 了 实 模式 编程 。16 位 实 模 式 程序 运行 于 模拟 的 MS-DOS 环境 中 , 使 
用 的 是 Irvine16.inc 头 文件 和 Irvine16 链接 库 。 


10.3.9 本 节 回 顾 


1.IFB 伪 指 令 的 作用 是 什么 ? 
2. IFIDN 伪 指 令 的 作用 是 什么 ? 
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3. 哪 条 伪 指令 能 停止 所 有 后 续 的 宏 展开 ? 
4. IFIDNI 与 IFIDN 有 什么 不 同 ? 
5. IFDEF 伪 指 令 的 作用 是 什么 ? 


10.4 定义 重复 语句 块 


MASM 有 许多 循环 伪 指 令 用 于 生成 重复 的 语句 块 : WHILE、REPEAT、FOR 和 FORC。 
与 LOOP 指令 不 同 ， 这 些 伪 指令 只 在 汇编 时 起 作用 ， 并 使 用 常量 值 作为 循环 条 件 和 计数 器 : 
e WHILE 伪 指 令 根据 一 个 布尔 表达 式 来 重复 语句 块 。 
e REPEAT 伪 指令 根据 计数 器 的 值 来 重复 语句 块 。 
e FOR 伪 指 令 通 过 遍历 符号 列表 来 重复 语句 块 。 
e FORC 伪 指 令 通 过 遍历 字符 串 来 重复 语句 块 。 
示例 程序 Repeat.asm 演示 了 上 述 每 一 条 伪 指 令 。 


10.4.1 WHILE 伪 指 令 
WHILE 伪 指 令 重 复 一 个 语句 块 ， 直 到 特定 的 常量 表达 式 为 真 。 其 语法 如 下 : 


WHILE constExpression 
Sstatements 
ENDM 


下 面 的 代码 展示 了 如 何在 1 到 F000 0000h 之 间 生 成 斐 波 那 契 (Fibonacci) 数 ， 作 为 汇 
编 时 常数 序列 : 

.data 

all 

val2 = 1 

DWORD vall ;? 前 两 个 值 

DWORD val2 

val3 = vall + val2 

WHILE val3 LT 0F0000000h 


DWORD val3 
vall = val2 
val2 = val3 
val3 = vall + val2 


ENDM 
， 此 代码 生成 的 数值 可 以 在 清单 (.LST) 文件 中 查看 。 
10.4.2 ”REPEAT 伪 指令 
在 汇编 时 ，REPEAT 伪 指 令 将 一 个 语句 块 重复 固定 次 数 。 其 语法 如 下 : 


REPEAT constExpression 
statements 
ENDM 


constExpression 是 一 个 无 符号 整数 常量 表达 式 ， 用 于 确定 重复 次 数 。 
在 创建 数组 时 ，REPEAT 的 用 法 与 DUP 类 似 。 在 下 面 的 例子 中 ，WeatherReadings 结构 
含有 一 个 地 点 字符 串 和 一 个 包含 了 降雨 量 与 湿度 读数 的 数组 : 


WEEKS_PER YEAR = 52 


结 鸥 布 改 345 


WeatherReadings STRUCT 
location BYTE 50 DUP(0) 
REPEAT WEEKS PER YEAR 

LOCAL rainfall, humidity 
rainfall DWORD ? 
humidity DWORD ? 
ENDM 
WeatherReadings ENDS 


由 于 汇编 时 循环 会 对 降雨 量 和 湿度 重 定义 ,使 用 LOCAL 伪 指 令 可 以 避免 因 其 导致 的 错误 。 
10.4.3” FOR 伪 指 令 


FOR 伪 指令 通过 迭代 用 逗号 分 隔 的 符号 列表 来 重复 一 个 语句 块 。 列 表 中 的 每 个 符号 都 
会 引发 循环 的 一 次 迭代 过 程 。 其 语法 如 下 : 
FOR parameter,<argl,arg2,arg3,...> 


statements 
ENDM 


第 一 次 循环 迭代 时 , parameter 取 argl 的 值 ， 第 二 次 循环 迭代 时 , parameter 取 arg2 的 值 ; 
以 此 类 推 ， 直 到 列表 的 最 后 一 个 实 参 。 
学 生 注册 示例 ”现在 创建 一 个 学 生 注 册 的 场景 ， 其 中 ，COURSE 结构 含有 课程 编号 和 
学 分 值 ; SEMESTER 结构 包含 一 个 有 6 门 课 程 的 数组 和 一 个 计数 器 NumCourses: 


COURSE STRUCT 
Number BYTE 9 DUP(?) 
Credits BYTE ? 
COURSE ENDS 


;Semester 含有 一 个 课程 数组 。 
SEMESTER STRUCT 
Courses COURSE 6 DUP(<>) 
NumCourses WORD 3? 
SEMESTER ENDS 


使 用 FOR 循环 可 以 定义 4 个 SEMESTER 对 象 ， 每 一 个 对 象 都 从 由 尖 括 号 括 起 的 符号 列 
表 中 选择 一 个 不 同 的 名 称 : 
SR 


SemName SEMESTER <> 
ENDM 


如 果 查 看 列表 文件 就 会 发 现 如 下 变量 : 


data 

Fall2013 SEMESTER <> 
Spring2014 SEMESTER <> 
Summer2014 SEMESTER <> 
Fall2014 SEMESTER <> 


10.4.4 FORC 伪 指 令 


FORC 伪 指 令 通过 迭代 字符 串 来 重复 一 个 语句 块 。 字 符 串 中 的 每 个 字符 都 会 引发 循环 的 
一 次 迭代 过 程 。 其 语法 如 下 : 
FORC parameter, <string> 


statements 
ENDM 
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第 一 次 循环 和 迭代 时 ，parameter 等 于 字符 串 的 第 一 个 字符 ， 第 二 次 循环 迭代 时 ， 
parameter 等 于 字符 串 的 第 二 个 字符 ; 以 此 类 推 ， 直 到 最 后 一 个 字符 。 下 面 的 例子 创建 了 一 
个 字符 查找 表 ， 其 中 包含 了 一 些 非 字 母 字符 。 注 意 ，< 和 > 的 前 面 必 须 有 文字 字符 (! ) 运 
算 符 ， 以 防 它们 违反 FORC 伪 指 令 的 语法 : 


Delimiters LABEL BYTE 

FORC code,<@#$% gE*!<!>> 
BYTE "&code" 

ENDM 


生成 的 数据 表 如 下 所 示 ， 可 以 在 列表 文件 中 查看 : 


00000000 40 1 BYTE " 
00000001 23 1 BYTE " 
00000002 24 1 BYTE " 
00000003 25 1 BYTE " 
00000004 S5E 1 BYTE " 
00000005 26 1 BYTE " 
00000006 2A 1 BYTE " 
00000007 3C 1 BYTE ™ 
00000008 3E 1 BYTE " 


VA#*m >mW 站 人 e 


10.4.5 “示例 : 链表 


结合 结构 声明 与 REPEAT 伪 指 令 以 指示 汇编 器 创建 一 个 链表 的 数据 结构 是 相当 简单 的 。 
链表 中 的 每 个 节点 都 含有 一 个 数据 域 和 一 个 链接 域 : 


数据 | 链接 | > | 数据 | 链接 | | 数据 | 链接 | > 空 
在 数据 域 中 ， 一 个 或 多 个 变量 可 以 保存 每 个 节点 所 特有 的 数据 。 在 链接 域 中 ， 一 个 指针 
包含 了 链表 下 一 个 节点 的 地 址 。 最 后 一 个 节点 的 链接 域 通常 是 一 个 空 指针 。 现 在 编写 程序 创 
建 并 显示 一 个 简单 链表 。 首 先 ， 程 序 定义 一 个 节点 ， 其 中 含有 一 个 整数 (数据 ) 和 一 个 指向 


下 一 个 节点 的 指针 : 
ListNode STRUCT 
NodeData DWORD ? ; 节点 的 数据 
NextPtr DWORD ? ; 指向 下 一 个 节点 的 指针 


ListNode ENDS 


接着 REPEAT 伪 指 令 创 建 了 ListNode 对 象 的 多 个 实例 。 为 了 便于 测试 ，NodeData 域 含 
有 一 个 整数 常量 ， 其 范围 为 1 ~ 15。 在 循环 内 部 ， 计 数 器 加 1 并 将 值 插入 到 ListNode 域 : 


TotalNodeCount = 15 
NULL = 0 
Counter = 0 


.data 
LinkedList LABEL PTR ListNode 
REPEAT TotalNodeCount 
Counter = Counter + 1 
ListNode <Counter, ($ + Counter * SIZEOF ListNode)> 
ENDM 


表达 式 ($+Counter*SIZEOF ListNode) 告诉 汇编 器 把 计数 值 与 ListNode 的 大 小 相 乘 ， 
并 将 乘积 与 当前 地 址 计数 器 相 加 。 结 果 值 插入 结构 内 的 NextPtr 域 。[ 注意 一 个 有 趣 的 现象 ; 
位 置 计数 器 的 值 ($) 固定 在 表 的 第 一 节点 上 。] 该 表 用 尾 节 点 ( tail node) 来 标记 末尾 ， 其 
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NextPtr 域 为 空 (0 ): 


ListNode <0,0> 


当 程序 遍历 该 表 时 ， 它 用 下 面 的 语句 检索 NextPtr 域 ， 并 将 其 与 NULL 比较 ， 以 检查 是 
否 为 表 的 末尾 : 


mov eax (ListNode PTR [esi]).NextPtr 


cmp eax,NULL 436 


程序 清单 ”完整 的 程序 清单 如 下 所 示 。 在 main 中 ， 一 个 循环 遍历 链表 并 显示 全 部 的 节点 
值 。 与 使 用 固定 计数 值 控制 循环 相 比 ， 程 序 检查 是 否 为 尾 节点 的 空 指针 ， 若 是 则 停止 循环 : 


; 创建 一 个 链表 (List.asm) 
INCLUDE Irvine32.inc 


ListNode STRUCT 
NodeData DWORD ? 
NextPtr DWORD ? 

ListNode ENDS 


TotalNodeCount = 15 
NULL = 0 
Counter = 0 


.data 
LinkedList LABEL PTR ListNode 
REPEAT TotalNodeCount 

Counter = Counter + 1 


ListNode <Counter, ($ + Counter * SIZEOF ListNode)> 
ENDM 


ListNode <0,0> ; 尾 节点 
.Code 
main PROC 

mov esi,OFFSET LinkedList 


; 显示 NodeData 域 的 值 。 
; 检查 是 否 为 尾 节点 。 
mov eax, (ListNode PTR [esi]).NextPtr 
cmp eax,NULL 
je quit 
;显示 节点 数据 。 
mov eax,(ListNode PTR [esi]).NodeData 
call WriteDec 
Sall ‘CElE 


; 获得 下 一 个 节点 的 指针 。 
mov esi,(ListNode PTR [esi]).NextPtr 
jmp NextNode 


quit: 
exit 

main ENDP 

END main 


10.4.6 ”本 节 回 顾 


1. 简要 说 明 WHILE 伪 指 令 。 
2. 简要 说 明 REPEAT 伪 指 令 。 
3. 简要 说 明 FOR 伪 指 令 。 437 


348 第 10 苹 


4. 简要 说 明 FORC 伪 指 令 ， 
5. 哪 条 伪 指 令 最 适 于 生成 字符 查找 表 ? 
6. 写 出 由 下 述 宏 生 成 的 语句 : 


FOR val,<100,20,30> 
BYTE 0,0,0,val 
ENDM 


7. 设 已 定义 如 下 宏 mRepeat: 


mRepeat MACRO char,count 
LOCAL L1 
mov cx,count 
Ll: mov ah,2 
mov dl,char 
int 21h 
loop Ll 
ENDM 


当 按 照 下 列 语句 (a，b 和 c) 进行 mRepeat 宏 展开 时 ， 请 写 出 预 处 理 程序 生成 的 代码 : 


mRepeat 'X',50 入 
mRepeat AL,20 
mRepeat byteVal,countVal 2 
8. 挑战 : 在 链表 示例 程序 ( 10.4.5 节 ) 中 , 如果 REPEAT 循环 的 代码 如 下 ， 那 么 程序 运行 结 


果 如 何 ? 


REPEAT TotalNodeCount 

Counter = Counter + 1 

ListNode <Counter, ($ + SIZEOF ListNode)> 
ENDM 


10.5 ”本 章 小 结 


结构 ( structure) 是 创建 用 户 定义 类 型 时 使 用 的 模板 或 模式 。Windows API 库 中 已 经 定 
义 了 大 量 的 结构 ， 用 于 实现 应 用 程序 与 链接 库 之 间 的 数据 传递 。 结 构 可 以 包含 不 同类 型 的 字 
段 。 使 用 字段 初始 值 就 可 以 对 每 个 字段 进行 声明 ， 即 给 该 字段 分 配 一 个 默认 值 。 

结构 自身 不 占 内 存 空 间 ， 但 是 结构 变量 会 占用 内 存 。SIZEOF 运算 符 返回 变量 所 占 的 字 
节 数 。 

通过 使 用 结构 变量 或 形 如 [esi] 的 间接 操作 数 ， 点 运算 符 〈.) 对 结构 字段 进行 引用 。 如 
果 是 间接 操作 数 来 引用 结构 字段 ， 那 么 必须 使 用 PTR 运算 符 指定 结构 类 型 ， 比 如 ( COORD 
PTR [esi]) .X。 

结构 包含 的 字段 也 可 以 是 结构 。 醉 汉 行 走 程序 (10.1.6 节 ) 给 出 了 例子 ， 其 中 的 
DrunkardWalk 结构 就 包含 了 一 个 COORD 结构 的 数组 。 

宏 通 常 在 程序 开始 的 时 候 定义 ， 位 于 数据 段 和 代码 段 之 前 。 之 后 ， 在 调用 宏 时 ， 预 处 理 
程序 就 把 宏 代码 复制 插入 到 程序 内 调用 发 生 的 位 置 。 

宏 可 以 有 效 地 作为 过 程 调用 的 封装 器 ( wrappers)， 以 简化 参数 传递 和 寄存 器 人 栈 。 比 如 
宏 mGotoxy、mDumpMem 和 mWriteString 就 是 封装 器 的 例子 ， 它 们 调用 本 书 链接 库 的 过 程 。 

宏 过 程 (或 宏 ) 是 指 被 命名 的 汇编 语言 语句 块 。 宏 函数 与 之 类 似 ， 只 不 过 宏 函 数 会 返回 
一 个 常量 值 。 
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条 件 汇编 伪 指令 ， 如 IF、IFNB 和 IFIDNI 可 以 被 用 于 检测 实 参 是 否 超出 范围 ， 是 否 缺 


失 ， 以 及 是 否 为 错误 类 型 。ECHO 伪 指 令 显示 汇编 时 的 错误 消息 ， 以 提醒 程序 员 将 实 参 传 递 


给 宏 时 出 现 的 错误 。 


替换 运算 符 (&&) 解析 对 参数 名 的 有 歧义 的 引用 。 展 开 运算 符 (%) 展开 文本 宏 并 将 常量 
表达 式 转换 为 文本 。 文 字 文本 运算 符 ( <>) 把 不 同 的 字符 和 文本 组 合 为 一 个 文本 。 文 字 字 符 
运算 符 (1 ) 强制 预 处 理 程序 将 预定 义 运算 符 当 作 普 通 字 符 。 

重复 块 伪 指令 能 够 减少 程序 的 重复 代码 量 。 这 些 伪 指令 有 : 

e WHILE 伪 指令 根 据 一 个 布尔 表达 式 来 重复 语句 块 。 

。 REPEAT 伪 指令 根据 计数 器 的 值 来 重复 语句 块 。 

e FOR 伪 指 令 通 过 遍历 符号 列表 来 重复 语句 块 。 

e FORC 伪 指 令 通过 遍历 字符 串 来 重复 语句 块 。 


10.6 关键 术语 


10.6.1 术语 


conditional-assembly directive (条 件 汇编 伪 指 令 ) 
default argument initializer (默认 参数 初始 值 


设 定 ) 


expansion operator(%) (展开 运算 符 )(%) 


field (字段 ) 
invoke(a macro) (调用 )( 宏 ) 


literal-character operator(!)( 文 字 字符 运算 符 )(! ) 
literal-text operator(<>) (文字 文本 运算 符 )(<>) 


macro ( 宏 ) 


10.6.2 ”运算 符 和 伪 指 令 


ALIGN 
ECHO 
ELSE 
ENDIF 
ENDS 
FOR 
REPEAT 
REQ 
SIZEOF 


10.7 复习 题 和 练习 


10.7.1 简 答 题 
1. STRUCT 伪 指 令 的 用 途 是 什么 ? 


IFB 
IFDIF 
IFDIFI 
IFIDN 
STRUCT 
TYPE 
UNION 


macro function( 宏 函数 ) 

macro procedure ( 宏 过 程 ) 

nested macro ( 宏 嵌 套 ) 

parameters ( 形 参 ) 

preprocessing step( 预 处 理 步 又) 

structure (结构 ) 

substitution operator(&) (替换 运算 符 )(&) 
union (联合 ) 


IFIDNI 
IFNB 
IFNDEF 
LENGTHOF 
MACRO 
OFFSET 
WHILE 
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MD 


孙 
4. 
5. 
6. 
7. 
8. 
9. 


. 假设 定义 了 如 下 结构 : 


RentalInvoice STRUCT 
invoiceNum BYTE 5 DUP(' ') 
dailyPrice WORD ? 
daysRented WORD ? 

RentalInvoice ENDS 


则 下 列 声明 是 否 有 效 : 


4d. rentals RentalInvoice <> 

b. RentalInvoice rentals <> 

c. march RentalInvoice <'12345',10,0> 
d. RentalInvoice <,10,0> 

e. Current RentalInvoice <,15,0,0> 


( 真 / 假 ): 宏 不 能 包含 数据 定义 。 

LOCAL 伪 指 令 的 用 途 是 什么 ? 

哪 条 伪 指 令 能 在 控制 台 上 显示 汇编 时 消息 ? 

哪 条 伪 指令 标志 条 件 语句 块 的 结束 ? 

列 出 所 有 能 在 常量 布尔 表达 式 中 使 用 的 关系 运算 符 。 
宏 定 义 中 的 & 运算 符 有 什么 作用 ? 

宏 定 义 中 的 ! 运算 符 有 什么 作用 ? 


10. 宏 定 义 中 的 % 运算 符 有 什么 作用 ? 
10.7.2 算法 基础 


1. 


LO DD 


Uh 


~1 CN 


创建 包含 两 个 字段 的 结构 SampleStruct : fieldl 为 一 个 16 位 WORD，field2 为 含有 20 个 32 位 
DWORD 的 数组 。 不 需 定义 字段 初始 值 。 


. 编写 一 条 语句 检索 结构 SYSTEMTIME 的 wHour 字段 。 
. 使 用 如 下 Triangle 结构 ， 声 明 一 个 结构 变量 并 将 其 三 个 顶点 分 别 初始 化 为 (0, 0)、(5, 0) 和 (7, 6): 


Triangle STRUCT 
VerteXx1 COORD <> 
Vertex2 COORD <> 
Vertex3 COORD <> 

Triangle ENDS 


.声明 一 个 Triangle 结构 的 数组 ， 并 编写 一 个 循环 ， 用 随机 坐标 对 每 个 三 角形 的 Vertexl 进行 初始 化 ， 


坐标 范围 为 (0…10，0…10 ) 。 


. 编写 宏 mPrintChar， 在 屏幕 上 显示 一 个 字符 。 宏 应 有 两 个 参数 : 第 一 个 指定 显示 的 字符 ， 第 二 个 指 


定 字符 重复 的 次 数 。 示 例 调用 如 下 : 


mprintChar 'X',20 


. 编写 宏 mGenRandom，, 在 0 到 -1 之 间 随 机 生成 一 个 整数 ，n 为 宏 的 唯一 参数 。 
. 编写 宏 mPromptInteger， 显 示 提 示 并 接收 用 户 输入 的 一 个 整数 。 向 该 宏 传递 一 个 字符 串 文 本 和 一 个 


双 字 变量 名 。 示 例 调 用 如 下 : 


-data 

minVal DWORD ? 

‘Code 

mPromptIinteger "Enter the minimum value", minVal 


.编写 宏 mWriteAt， 定 位 光标 并 在 控制 台 窗 口 显示 一 个 字符 串 文本 。 建 议 : 调用 本 书 宏 库 中 的 


mGotoxy 和 mWrite。 
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9. 用 如 下 语句 调用 10.2.5 节 的 宏 mWriteString， 请 写 出 其 生成 的 展开 代码 : 


mWwritestr namePrompt 


10. 用 如 下 语句 调用 10.2.5 节 的 宏 mReadString， 请 写 出 其 生成 的 展开 代码 : 


mReadstr customerName 


11. 编写 宏 mDumpMemx， 接 收 一 个 参数 和 一 个 变量 名 。 该 宏 必须 调用 本 书 链接 库 的 宏 mDumpMem， 
并 向 其 传递 变量 的 偏 移 量 ， 存 储 对 象 的 数量 和 对 象 的 大 小 。 演 示 对 宏 mDumpMemx 的 调用 。 

12. 举例 说 明 有 默认 实 参 初始 值 的 宏 形 参 。 

13. 编写 一 个 简短 的 例子 来 使 用 IF、ELSE 和 ENDIF 伪 指 令 。 

14. 编写 一 条 语句 ， 用 IF 伪 指 令 检 查 常量 宏 参数 Z 的 值 ; 如 果 Z 小 于 0， 则 在 汇编 时 显示 一 条 消息 说 
明 Z 是 无 效 的 。 

15. 编写 一 个 简短 的 宏 ， 在 宏 形 参 媒人 文本 字符 串 时 ， 演 示 运 算 符 & 的 用 法 。 

16. 假设 宏 mLocate 的 定义 如 下 : 


mLocate MACRO xval,yval 


IF xval LT 0 ?} Xxval < 03 
EXITM ;; 若是 ， 则 退出 
ENDIF 
IF yval LT 0 7 wal < 02 
EXITM ;;? 若是 ， 则 退出 
ENDIF 
mov bx,0 ?; 视频 页 面 0 
mov ah,2 5 定位 光标 
mov dh,yval 
mov dl,xval ;; 调用 BIOS 
int 10h 
ENDM 
若 用 下 述 语句 调用 该 宏 ， 请 写 出 预 处 理 程序 在 进行 宏 展开 时 生成 的 源 代码 : 
data 


row BYTE 15 

col BYTE 60 
.Code 

mLocate -2,20 
mLocate 10,20 
mLocate col,row 


10.8 编程 练习 


*1. 宏 mReadkey 
编写 一 个 宏 ， 等 待 一 次 按键 操作 并 返回 被 按 下 的 键 。 宏 参数 要 包括 ASCII 码 和 键盘 扫描 码 。 
提示 : 调用 本 书 链接 库 的 ReadChar。 编 写 程序 对 宏 进行 测试 。 比 如 ， 下 面 的 代码 等 待 一 次 按键 ， 
当 它 返回 时 ， 两 个 实 参 分 别 为 按键 的 ASCII 码 和 扫描 码 : 


-dat 

ascii BYTE ? 

scan BYTE ? 

.Code 

mReadkey ascii, scan 


*2. 宏 mWritestringAttr 
( 需 提前 阅读 11.1.11 节 。) 编写 一 个 宏 ， 用 指定 文本 颜色 向 控制 台 写 一 个 空 字 节 结束 的 字符 捉 。 
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"3. 


442 
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突 委 5. 


雄二 6. 


确 克 胡 ye 


真 丰 页 8 


ee 


宏 参 数 需 包括 字符 串 的 名 称 和 颜色 。 提 示 : 调用 本 书 链接 库 的 SetTextColor。 编 写 程序 ， 用 不 同 的 
颜色 和 字符 串 测试 该 宏 。 示 例 调用 如 下 : 


"data 

myString db "Here is my string",0 
.code 

mwritestring myString, white 


宏 mMove32 

编写 宏 mMove32， 接 收 两 个 32 位 的 内 存 操作 数 ， 并 将 源 操作 数 传送 到 目的 操作 数 。 编 写 程序 
对 宏 进 行 测试 。 
宏 mMult32 

创建 宏 mMult32， 将 两 个 32 位 内 存 操作 数 相 乘 ， 生 成 一 个 32 位 的 乘积 。 编 写 程序 对 宏 进行 
测试 。 
宏 mReadlnt 

创建 宏 mReadInt， 从 标准 输入 读 取 一 个 16 位 或 32 位 的 有 符号 整数 ， 并 用 实 参 返回 该 值 。 用 条 
件 运 算 符 使 得 宏 能 适应 预期 结果 的 大 小 。 编 写 程序 ， 向 宏 传递 不 同 大 小 的 操作 数 以 对 其 进行 测试 。 
宏 mWritelnt 

创建 宏 mWriteInt， 通 过 调用 WriteInt 库 过 程 向 标准 输出 写 一 个 有 符号 整数 。 向 宏 传递 的 参数 
可 以 是 字 节 、 字 或 双 字 。 在 宏 内 使 用 条 件 运 算 符 ， 使 之 能 适应 实 参 的 大 小 。 编 写 程序 ， 向 宏 传递 不 
同 大 小 的 实 参 以 对 其 进行 测试 。 
教授 丢失 的 手机 

当 10.1.6 节 的 醉酒 教授 在 校园 里 绕 圈 子 时 ， 我 们 发 现 他 在 路 上 的 某 个 地 方 丢 失 了 手机 。 在 对 
醉酒 路 线 进行 模拟 时 ， 程 序 必须 在 教授 停留 随机 时 长 的 任何 地 方 丢掉 手机 。 每 次 运行 程序 ， 都 必须 
在 不 同 的 时 间 间 隔 (和 位 置 ) 丢失 手机 。 
带 概率 的 醉 汉 行 走 问题 

在 测试 DrunkardWalk 程序 时 ， 你 可 能 已 经 注意 到 教授 徘徊 的 位 置 距离 起 点 不 会 太 远 。 这 种 情 
况 毫 无 疑问 是 由 教授 在 各 方向 移动 的 等 概率 造成 的 。 因 此 按照 如 下 条 件 来 修改 程序 : 教授 有 50% 
的 概率 沿 着 与 上 一 步 相 同 的 方向 行走 ; 有 10% 的 概率 选择 相反 的 方向 ， 有 20% 的 概率 会 向 右 或 向 
左 转 。 循 环 开始 前 指定 一 个 默认 的 起 步 方向 。 


. 移 位 多 个 双 字 


创建 一 个 宏 ,使 用 SHRD 和 SHLD 指令 ,将 一 个 32 位 整数 数组 向 任意 方向 移动 可 变 的 位 数 。 
编写 程序 对 宏 进行 测试 ， 把 同一 个 数组 向 两 个 方向 移动 并 显示 结果 。 可 以 假设 数组 为 小 端 顺 序 。 宏 
声明 示例 如 下 : 


mShiftDoublewords MACRO arrayName, direction, numberOfBits 


Parameters: 
arrayName Name of the array 
direction Right (R) or Left (L) 
numberOfBits Number of bit positions to shift 


*** 10. 三 操作 数 指令 
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有 些 计 算 机 指令 集 允许 算术 运算 指令 有 三 个 操作 数 。 这 种 操作 有 时 出 现在 用 于 向 学 生 介绍 
汇编 语言 概念 的 简单 虚拟 汇编 器 中 ,或 是 在 编译 器 中 使 用 中 间 语 言 的 时 候 。 在 下 面 的 宏 中 ,假设 
EAX 被 保留 用 于 宏 操 作 ， 但 是 还 未 保存 。 其 他 会 被 宏 修 改 的 寄存 器 必须 保存 。 所 有 的 参数 都 是 有 
符号 的 内 存 双 字 。 编 写 宏 模拟 下 述 操作 : 


过 
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add3 destination, sourcel, source2 


b. sub3 destination, sourcel, source2 (destination = sourcel 一 source2) 
Cc. mul3 destination, sourcel, source2 
d 


div3 destination, sourcel, source2 (destination = sourcel / source2) 


例如 ， 下 面 的 宏 调 用 实现 的 是 表达 式 x= (w+y) *z: 


.data 

temp DWORD ? 

.Code 

add3 temp, w, y ; 七 emP =w+y 
mul3 x, temp, Zz ;X= temp * 2 


编写 程序 测试 宏 ， 要求 实现 4 个 算术 表达 式 ， 每 个 表达 式 都 要 包含 多 个 操作 。 [444 | 
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MS-Windows 编程 


11.1 Win32 控制 台 编 程 


在 前 面 的 章节 中 ， 读 者 毫 无 疑问 已 经 对 如 何 实现 本 书 链接 库 ( Irvine32 和 Irvine64 ) 感 
到 好 奇 。 尽 管 这 些 链接 库 用 起 来 很 方便 ,但 是 ,我们 还 是 希望 读者 能 更 加 独立 一 些 ， 这 
样 既 可 以 创建 自己 的 链接 库 ， 也 可 以 修改 本 书 的 链接 库 。 为 此 ， 本 章 展 示 的 是 如 何 用 
32 位 Microsoft Windows API 进 行 控制 台 窗 口 编程 。 应 用 编程 接口 (API : Application 
Programming Interface) 是 类 型 、 常 数 和 函数 的 集合 体 ， 它 提供 了 一 种 用 计算 机 代码 操作 对 
象 的 方式 。 本 章 将 讨论 文本 IO 、 颜 色 选 择 、 时 间 与 日 期 、 数 据 文件 TO， 以 及 内 存 管理 的 
API 函数 。 同 时 ， 还 包括 了 本 书 64 位 链接 库 Irvine64 代码 的 一 些 例子 。 

通过 本 章 还 将 学 习 到 如 何 用 事件 处 理 循环 来 创建 图 形 化 窗口 应 用 程序 。 虽 然 不 建议 用 汇 
编 语 言 进 行 扩 展 图 形 应 用 程序 编程 ， 但 是 本 章 的 例子 将 有 助 于 揭示 高 级 语句 利用 抽象 而 隐藏 
的 一 些 内 部 细节 。 

最 后 ， 本 章 将 讨论 x86 处 理 器 的 内 存 管理 功能 ， 包 括 线性 和 逻辑 地 址 ， 以 及 分 段 和 分 
页 。 虽 然 本 科 操 作 系统 课程 对 这 些 内 容 讲述 得 范围 更 广 ， 内 容 更 细 ， 但 是 本 章 还 是 会 就 相关 
内 容 进行 基本 介绍 。 

为 什么 不 为 MS-Windows 编写 图 形 应 用 程序 ? 如 果 用 汇编 语言 或 C 语言 ， 那 么 图 形 程 
序 将 会 很 长 而 且 很 详细 。 多 年 来 ， 在 优秀 计算 机 设计 者 的 帮助 下 ，C 和 C++ 程序 员 一 直 在 
技术 细节 上 不 断 努 力 ， 如 图 形 设 备 处 理 、 信 息 发 布 、 字 体 标准 、 设 备 位 图 ， 以 及 映射 模式 
等 。 还 有 一 些 汇编 程序 员 与 出 色 的 网 站 专注 于 图 形 化 Windows 编程 。 

为 了 能 对 图 形 化 程序 员 有 所 帮助 ，11.2 节 以 通用 的 方式 介绍 了 32 位 图 形 化 编程 。 这 仅 
仅 是 开始 ， 但 它 会 激励 程序 员 在 这 个 方向 继续 前 进 。 本 章 最 后 的 小 结 列 出 了 进一步 学 习 所 需 
要 的 参考 书目 。 


Win32 Platform SDK 与 Win32 API 密切 相关 的 是 Microsoft Platform SDK (软件 开发 
工具 包 )， 它 集成 了 创建 MS-Windows 应 用 程序 的 工具 、 库 、 示 例 代码 和 文档 。Microsoft 网 
站 提供 了 完整 的 在 线 文档 。 在 www.msdn.microsoft.com 搜索 “ Platform SDK”。Platform 
SDK 可 以 免费 下 载 。 





11.1.1 背景 知识 


一 个 Windows 应 用 程序 开始 的 时 候 ， 要 么 创建 一 个 控制 台 窗 口 ， 要 么 创建 一 个 图 形 化 
窗口 。 本 书 的 项 目 文件 一 直 把 如 下 选项 与 LINK 命令 一 起 使 用 。 它 告诉 链接 器 创建 一 个 基于 
控制 台 的 应 用 程序 : 


/SUBSYSTEM:CONSOLE 
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控制 台 程序 的 外 观 和 操作 就 像 MS-DOS 窗口 ， 它 的 一 些 改进 部 分 将 在 后 面 进行 介绍 。 
控制 台 有 一 个 输入 缓冲 区 以 及 一 个 或 多 个 屏幕 缓冲 区 : 
@ 输入 缓冲 区 (input buffer) 包含 一 组 输入 记录 (input records)， 其 中 的 每 个 记录 都 是 
一 个 输入 事件 的 数据 。 输 入 事件 的 例子 包括 键盘 输入 、 鼠 标点 击 ， 以 及 用 户 调整 控 
制 台 窗 口 大 小 。 
e@ 屏幕 缓冲 区 (screen buffer) 是 字符 与 颜色 数据 的 二 维 数组 ， 它 会 影响 控制 台 窗 口 文 
本 的 外 观 。 
1. Win32 API 参考 信息 
函数 本 节 将 介绍 Win32 API 函数 的 子 集 并 给 出 一 些 简单 的 例子 。 由 于 篇 幅 的 限制 ， 
将 不 会 涉及 很 多 细节 。 如 果 想 了 解 更 多 信息 ， 请 访问 Microsoft MSDN 网 站 (目前 地 址 为 
www.msdn.microsoft.com)。 在 搜索 函数 或 标识 符 时 ， 把 Filtered by 参数 设置 为 Platform 
SDK。 此 外 ， 在 本 书 的 示例 程序 中 ，kernel32.txt 和 user32.txt 文件 列 出 了 kernel32.lib 和 
user32.lib 库 中 的 全 部 函数 名 。 
常数 阅读 Win32 API 郴 数 的 文档 时 ， 常 常会 见 到 常量 名 ， 如 TIME_ZONE _ID_ 
UNKNOWN。 人 少数 情况 下 ， 这 些 常 量 已 经 在 SmallWin.inc 中 定义 过 。 如 果 没 有 在 该 文 
件 中 定义 ， 那 么 请 查看 本 书 的 网 站 。 例 如 ， 头 文件 WinNTh 就 定义 了 TIME ZONE_ID_ 
UNKNOWN 及 相关 常量 : 


#define TIME ZONE ID UNKNOWN 0 
#define TIME ZONE ID STANDARD 1 
#define TIME ZONE ID DAYLIGHT 2 


利用 这 个 信息 ， 可 以 将 下 述 语句 添加 到 SmallWin.h 或 者 用 户 自己 的 头 文件 中 : 

TIME ZONE ID UNKNOWN = 0 

TIME ZONE ID STANDARD = 1 

TIME ZONE_ID DAYLIGHT = 2 

2. 字符 集 和 Windows API 函数 

调用 Win32 API1 也 数 时 会 使 用 两 类 字符 集 : 8 位 的 ASCIVANSI 字 符 集 和 16 位 的 
Unicode 字符 集 (所 有 近期 的 Windows 版 本 中 都 有 )。Win32 函数 可 以 处 理 的 文本 通常 有 
两 种 版 本 : 一 种 以 字母 A 结尾 (8 位 ANSI 字 符 )， 另 一 种 以 W 结尾 ( 宽 字符 集 ， 包 括 了 
Unicode)。WriteConsole 即 为 其 中 之 一 : 

® WriteConsoleA 

® WriteConsoleW 

Windows95 和 98 不 支持 以 W 结尾 的 函数 名 。 另 一 方面 ， 在 所 有 近期 的 Windows 版 本 
中 ，Unicode 都 是 原生 字符 集 。 例 如 调用 名 为 WriteConsoleA 的 函数 ， 则 操作 系统 将 把 字符 
从 ANSI 转换 为 Unicode， 再 调用 WriteConsoleW。 

在 Microsoft MSDN 链接 库 的 函数 文件 中 ， 如 WriteConsole， 尾 字符 A 和 W 都 被 省 略 
了 。 本 书 程序 的 头 文件 重新 将 函数 名 定义 为 WriteConsoleA : 


WriteConsole EQU <WriteConso1lLeR> 

这 个 定义 使 得 程序 能 按 WriteConsole 的 通用 名 对 其 进行 调用 。 

3. 高 级 别 和 低级 别 访问 

控制 台 访问 有 两 个 级 别 ， 这 就 能 够 在 简单 控制 和 完全 控制 之 间 进 行 权 衡 : 
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e 高 级 别 控 制 台 函数 从 控制 台 输 入 缓冲 区 读 取 字 符 流 ， 并 将 字符 数据 写 人 控制 台 的 屏 
幕 缓冲 区 。 输 入 和 输出 都 可 以 重 定向 到 文本 文件 。 
e 低级 别 控制 台 函 数 检索 键盘 和 鼠标 事件 ， 以 及 用 户 与 控制 台 窗 口交 互 ( 拖 上 中 、 调 整 大 
小 等 ) 的 详细 信息 。 这 些 函 数 还 允许 对 窗口 大 小 、 位 置 以 及 文本 颜色 进行 详细 控制 。 
4. Windows 数据 类 型 
Win32 函数 使 用 C/C++ 程序 员 的 函数 声明 进行 记录 。 在 这 些 声明 中 ， 所 有 函数 参数 
类 型 要 么 基于 标准 C 类 型 ， 要么 基于 MS-Windows 预定 义 类 型 ( 表 11-1 列 出 了 部 分 类 型 ) 
之 一 。 区 分 数据 值 和 指向 值 的 指针 是 很 重要 的 。 以 字母 LP 开头 的 类 型 名 是 长 指针 ( long 
pointer)， 指 向 其 他 对 象 。 
5. SmallWin.inc 头 文件 
本 书 作者 创建 的 SmallWin.inc 是 一 个 头 文件 ， 其 中 包含 了 Win32 API 编程 的 常量 定义 、 
等 价 文本 以 及 函数 原型 。 通 过 本 书 一 直 使 用 的 Irvine32.inc，SmallWin.inc 被 自动 包含 在 程 
序 中 。 该 文件 位 于 本 书 示例 程序 的 安装 文件 夹 \Examples\Libs32 内 。 大 多 数 常 量 都 可 以 在 用 
于 C 和 C++ 编程 的 头 文件 Windows.h 中 找到 。 与 它 的 名 字 不 同 ，SmallWin.inc 文件 相当 大 ， 
因此 这 里 只 展示 其 突出 部 分 : 


DO_ NOT SHARE = 0 


NULL = 0 
TRUE = 1 
FALSE = 0 


?Win32 控制 台 句 柄 

STD_INPUT HANDLE EQU -10 
STD OUTPUT HANDLE EQU -11 
STD _ ERROR HANDLE EQU -12 


类 型 HANDLE 是 DWORD 的 代名词 ， 能 帮助 函数 原型 与 Microsoft Win32 文档 更 加 一 致 : 


HANDLE TEXTEQU <DWORD> 
表 11-1 MS-Windows 与 MASM 的 类 型 转换 


MS-Windows 类 型 说 明 

BOOL, BOOLEAN 布尔 值 (TRUE 或 FALSE) 

BYTE BYTE 8 位 无 符号 整数 

CHAR 8 位 Windows ANSI 字符 

COLORREF 作为 颜色 值 的 32 位 数值 

DWORD 32 位 无 符号 整数 

HANDLE 对 象 句柄 

HFILE 用 OpenFile 打开 的 文件 的 句柄 

INT 32 位 有 符号 整数 

LONG 32 位 有 符号 整数 

LPARAM 消息 参数 ， 由 窗口 过 程 和 回调 函数 使 用 

LPCSTR 32 位 指针 ， 指 向 由 8 位 Windows (ANSI) 字符 组 成 的 空 字 节 结束 的 字符 串 常量 
LPCVOID 指向 任何 类 型 的 常量 

LPSTR 32 位 指针 ， 指 向 由 8 位 Windows (ANSI) 字符 组 成 的 空 字 节 结束 的 字符 申 
LPCTSTR 32 位 指针 ， 指 向 对 Unicode 和 双 字 节 字 符 集 可 移植 的 字符 串 常量 

LPTSTR PTR WORD | 32 位 指针 ， 指 向 对 Unicode 和 双 字 节 字符 集 可 移植 的 字符 串 


LPVOID DWORD 32 位 指针 ， 指 向 未 指定 类 型 
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( 续 ) 


MS-Windows 类 型 说 明 
LRESULT 窗口 过 程 和 回调 函数 返回 的 32 位 数值 

SIZET 一 个 指针 可 以 指向 的 最 大 字 节 数 

UNIT DWORD 32 位 无 符号 整数 

WNDPROC DWORD | 32 位 指针 ， 指 向 窗口 过 程 

WORD 16 位 无 符号 整数 

WPARAM 作为 参数 传递 给 窗口 过 程 或 回调 函数 的 32 位 数值 


SmallWin.inc 也 包括 用 于 Win32 调用 的 结构 定义 。 下 面 给 出 了 两 个 结构 定义 : 


COORD STRUCT 
X WORD ? 
Y WORD ? 

COORD ENDS 


SYSTEMTIME STRUCT 
wYear WORD ? 
wMonth WORD ? 
wDayOfWeek WORD ? 
wDay WORD ? 
wHour WORD ? 
wMinute WORD ? 
wSecond WORD ? 
wMilliseconds WORD ? 
SYSTEMTIME ENDS 


最 后 ，SmallWin.inc 包含 了 本 章 所 有 的 Win32 函数 原型 。 

6. 控制 台 句 柄 

几乎 所 有 的 Win32 控制 台 函 数 都 要 求 向 其 传递 一 个 句柄 作为 第 一 个 实 参 。 句 柄 (handle) 是 
一 个 32 位 无 符号 整数 ， 用 于 唯一 标识 一 个 对 象 ， 例 如 一 个 位 图 、 画 笔 或 任何 输入 /输出 设备 : 


STD_INPUT_HANDLE standard input 
STD OUTPUT HANDLE standard output 
STD_ERROR_HANDLE standard error output 


上 述 句 柄 中 的 后 两 个 用 于 写 控制 台 活跃 屏幕 缓冲 区 。 
GetStdHandle 函数 返回 一 个 控制 台 流 的 句柄 : 输入 、 输 出 或 错误 输出 。 基 于 控制 台 的 程 
序 中 所 有 的 输入 /输出 操作 都 需要 句柄 。 函 数 原型 如 下 : 
GetstdHandle PROTO, 
nstdHandle:HANDLE ;句柄 类 型 
nStdHandle 可 以 是 STD_ INPUT_HANDLE、STD _ OUTPUT_HANDLE 或 者 STD ERROR _ 
HANDLE。 函 数 用 EAX 返回 句柄 ， 且 应 将 它 复制 给 变量 保存 。 下 面 是 一 个 调用 示例 : 


data 

inputHandle HANDLE ? 

.Code 
INVOKE GetStdHandle, STD INPUT HANDLE 
mov inputHandle,eax 


11.1.2 ”Win32 控制 台 函 数 
表 11-2 为 所 有 Win32 控制 台 函 数 的 一 览 表 '。 在 www.msdn.microsoft.com 上 可 以 找到 
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MSDN 库 中 每 个 函数 的 完整 描述 。 
提示 “Win32 API 函数 不 保存 EAX、EBX、ECX 和 EDX， 因 此 程序 员 需 自己 完成 





这 些 寄 存 器 的 入 栈 和 出 栈 操作 。 


表 11-2 Win32 控制 台 函 数 


函数 描述 
AllocConsole 为 调用 进程 分 配 一 个 新 控制 台 
CreateConsoleScreenBuffer 创建 控制 台 屏 幕 缓冲 区 
ExitProcess 结束 进程 及 其 所 有 线程 
FillConsoleOutputAttribute 为 指定 数量 的 字符 单元 格 设置 文本 和 背景 颜色 属性 
FillConsoleOutputCharacter 按 指定 次 数 将 一 个 字符 写 人 屏幕 缓冲 区 
FlushConsoleInputBuffer 刷新 控制 台 输 入 缓冲 区 
FreeConsole 将 主 调 进程 与 其 控制 台 分 离 
GenerateConsoleCtrlEvent 向 控制 台 进程 组 发 送 指定 信号 ， 这 些 进 程 组 共享 与 主 调 进程 关联 的 控制 台 
GetConsoleCP 获取 与 主 调 进程 关联 的 控制 台 使 用 的 输入 代码 页 
GetConsoleCursorInfo 获取 指定 控制 台 屏 幕 缓冲 区 光标 大 小 和 可 见 性 的 信息 
GetConsoleMode 获取 控制 台 输入 缓冲 区 的 当前 输入 模式 或 控制 台 屏 幕 缓冲 区 的 当前 输出 模式 
GetConsoleOutputCP 获取 与 主 调 进程 关联 的 控制 台 使 用 的 输出 代码 页 
GetConsoleScreenBufferInfo 获取 指定 控制 台 屏 幕 缓冲 区 信息 
GetConsoleTitle 获取 当前 控制 台 窗 口 的 标题 栏 字符 串 
GetConsoleWindow 获取 与 主 调 进程 关联 的 控制 台 使 用 的 窗口 句柄 


GetLargestConsoleWindowSize 获取 控制 台 窗 口 最 大 可 能 的 大 小 
GetNumberOfConsoleInputEvents ”| 获取 控制 台 输 入 缓冲 区 中 未 读 输入 记录 的 个 数 
GetNumberOfConsoleMouseButtons | 获取 当前 控制 台 使 用 的 鼠标 按钮 数 


GetStdHandle 获取 标准 输入 、 标 准 输出 或 标准 错误 设备 的 句柄 

HandlerRoutine 与 SetConsoleCtrlHandler 函数 一 起 使 用 的 应 用 程序 定义 的 函数 
PeekConsoleInput 从 指定 控制 台 输 入 缓冲 区 读 取 数 据 ， 且 不 从 缓冲 区 删除 该 数据 
ReadConsole 从 控制 台 输 入 缓冲 区 读 取 并 删除 输入 字符 

ReadConsoleInput 从 控制 台 输 入 缓冲 区 读 取 并 删除 该 数据 

ReadConsoleOutput 从 控制 台 屏 幕 缓冲 区 的 矩形 字符 单元 格 区 域 读 取 字 符 和 颜色 属性 数据 
ReadConsoleOutputAttribute 从 控制 台 屏 幕 缓冲 区 的 连续 单元 格 复制 指定 数量 的 前 景 和 背景 颜色 属性 
ReadConsoleOutputCharacter 从 控制 台 屏 幕 缓冲 区 的 连续 单元 格 复制 若干 字符 
ScrollConsoleScreenBuffer 移动 屏幕 缓冲 区 内 的 一 个 数据 块 

SetConsoleActiveScreenBuffer 设置 指定 屏幕 缓冲 区 为 当前 显示 的 控制 台 屏 幕 缓冲 区 

SetConsoleCP 设置 主 调 过 程 的 控制 台 输 入 代码 页 

SetConsoieCtrlHandler 为 主 调 过 程 从 处 理 函 数列 表 中 添加 或 删除 应 用 程序 定义 的 HandlerRoutine 
SetConsoleCursorInfo 设置 指定 控制 台 屏 幕 缓冲 区 光标 的 大 小 和 可 见 度 
SetConsoleCursorPosition 设置 光标 在 指定 控制 台 屏 幕 缓冲 区 中 的 位 置 

SetConsoleMode 设置 控制 台 输入 缓冲 区 的 输入 模式 或 者 控制 台 屏 幕 缓冲 区 的 输出 模式 
SetConsoleOutputCP 设置 主 调 过 程 的 控制 台 输出 代码 页 

SetConsoleScreenBufferSize 修改 指定 控制 台 屏 幕 缓冲 区 的 大 小 

SetConsoleTextAttribute 设置 写 人 屏幕 缓冲 区 的 字符 的 前 景 (文本 ) 和 背景 颜色 属性 
SetConsoleTitle 为 当前 控制 台 窗 口 设置 标题 栏 字符 串 


SetConsoleWindowInfo 设置 控制 台 屏 幕 缓冲 区 窗口 当前 的 大 小 和 位 置 
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。 ( 续 ) 
函数 描述 


SetStdHandle 设置 标准 输入 、 输 出 和 标准 错误 设备 的 句柄 

WriteConsole 向 由 当前 光标 位 置 标 识 开 始 的 控制 台 屏 幕 缓冲 区 写 一 个 字符 申 
WriteConsoleInput 直接 向 控制 台 输 入 缓冲 区 写 数据 

WriteConsoleOutput 向 控制 台 屏幕 缓冲 区 内 指定 字符 单元 格 的 矩形 块 写 字符 和 颜色 属性 数据 
WriteConsoleOutputAttribute 向 控制 台 屏幕 缓冲 区 的 连续 单元 格 复制 一 组 前 景 和 背景 颜色 属性 
WriteConsoleOutputCharacter 向 控制 台 屏 幕 缓冲 区 的 连续 单元 格 复制 一 组 字符 


11.1.3 ”显示 消息 框 
Win32 应 用 程序 生成 输出 的 一 个 最 简单 的 方法 就 是 调用 MessageBoxA 函数 : 


MessageBoxA PROTO, 


hWnd : DWORD, ; 窗口 句柄 ( 可 以 为 空 ) 
lpText:PTR BYTE, ; 字符 串 ， 对 话 框 内 
lpCaption:PTR BYTE, ; 字符 串 ， 对 话 框 标题 
uType:DWORD ; 内 容 和 行为 


基于 控制 台 的 应 用 程序 可 以 将 hWnd 设置 为 空 ， 表 示 该 消息 框 没有 相关 的 包含 窗口 或 父 
窗口 。lpText 参数 是 指向 空 字 节 结束 字符 串 的 指针 ， 该 字符 串 将 出 现在 消息 框 内 。lpCaption 
参数 指向 作为 对 话 框 标题 的 空 字 节 结束 字符 串 。uType 参数 指定 对 话 框 的 内 容 和 行为 。 

内 容 和 行为 uType 参数 包含 的 位 图 整数 组 合 了 三 种 选项 : 显示 按钮 、 图 标 和 默认 按钮 
选择 。 几 种 可 能 的 按钮 组 合 如 下 : 

e MB OK 

e MB OKCANCEL 
MB_YESNO 
MB_ YESNOCANCEL 
MB RETRYCANCEL 
MB_ ABORTRETRYIGNORE 

e MB CANCELTRYCONTINUE 

默认 按钮 ”可 以 选择 按钮 作为 用 户 点 击 Enter 键 时 的 自动 选项 。 选 项 包括 MB_ 
DEFBUTTON1 (默认 )、MB DEFBUTTON2、MB_DEFBUTTON3 和 MB_DEFBUTTON4。 
按钮 从 左 到 右 ， 从 1 开始 编号 。 

图 标 ”有 四 个 图 标 可 用 。 有 时 多 个 常数 会 产生 相同 的 图 标 : 

e 停止 符 : MB_ICONSTOP、MB_ICONHAND 或 MB_ICONERROR 

e 问号 (? ): MB_ICONQUESTION 

e 信息 符 (i): MB_ICONINFORMATION、MB_ICONASTERISK 

e 感叹 号 (1 ): MB _ICONEXCLAMATION、MB_ICONWARNING 

返回 值 ”如果 MessageBoxA 失败 ， 则 返回 零 ， 否则 ， 它 将 返回 一 个 整数 以 表示 用 户 在 


关闭 对 话 框 时 点 击 的 按钮 。 选 项 包括 IDABORT、IDCANCEL 、IDCONTINUE 、IDIGNORE 、、 


IDNO IDOK IDRETRY IDTRYAGAIN， 以 及 IDYES。Smallwin.inc 中 有 所 有 这 些 选项 的 定义 。 


Smallwin.inc 将 MessageBoxA 重 定义 为 MessageBox， 这 个 名 字 看 上 去 具有 更 强 的 
用 户 友好 性 。 
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如 果 想 要 消息 框 窗口 浮动 于 桌面 所 有 其 他 窗口 之 上 ， 就 在 传递 的 最 后 一 个 参数 (uType 
参数 ) 值 上 添加 MB_SYSTEMMODAL 选项 。 

1. 演示 程序 

下 面 将 通过 一 个 小 程序 来 演示 函数 MessageBoxA 的 一 些 功能 。 第 一 个 函数 调用 显示 一 
条 警告 信息 : 


a The current operaticn mav take years to complete 





Ll 


第 二 个 函数 调用 显示 一 个 问号 图 标 以 及 Yes/No 按钮 。 如 果 用 户 选 择 Yes 按钮 ， 则 程序 
利用 返回 值 选择 一 个 操作 : 


| 


A matching user account was not found. 
Do you wish to continue? 





第 三 个 函数 调用 显示 一 个 信息 图 标 以 及 三 个 按钮 : 





Setect Yes to save 3 backup fre before <ontinuwng. 
or chek Cancel tc stop the operation 


@ Th operation not supported by your user account. 


[ ] 





2. 程序 清单 
MessageBoxA 演示 程序 的 完整 清单 如 下 所 示 。 函 数 MessageBoxA 重 命名 为 函数 
MessageBox ， 这 样 就 可 以 使 用 更 加 简单 的 函数 名 : 


; 演示 MessageBoxR (MessageBox .asm) 


INCLUDE Irvine32 .inc 
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.data 

CaptionW BYTE “Warning" ,0 

warningMsg BYTE “The current operation may take years " 
BYTE “to complete.",0 


captionQ BYTE “Question",0 
questionMsg BYTE “A matching user account was not found.” 
BYTE 0dh,0ah,"Do you wish to continue?",0 


captionc BYTE "Information",0 
infoMsg BYTE "Select Yes to save a backup file " 
BYTE "before continuing,",0dh,0ah 
BYTE "or click Cancel to stop the operation'",0 


captionH BYTE “Cannot View User List",0 

haltMsg BYTE “This operation not supported by your " 
BYTE "user account.",0 

“Code 

main PROC 

; 显示 感叹 号 图 标 和 OK 按钮 


INVOKE MessageBox, NULL, ADDR warningMsg, 
RDDR captionWw, 


MB OK + MB ICONEXCLAMATION 
? 显示 问号 图 标 和 Yes/No 按钮 
INVOKE MessageBox, NULL, ADDR questionMsg, 
ADDR captionQ, MB YESNO + MB ICONQUESTION 


7 解释 用 户 点 击 的 按钮 


cmp eax,IDYES ; 点 击 的 是 Yes 按钮 吗 ? 
; 显示 信息 图 标 和 Yes/No/Cancel 按钮 
INVOKE MessageBox, NULL, ADDR infoMsg, 
ADDR captionC, MB YESNOCANCEL + MB ICONINFORMATION 入 
+ MB_DEFBUTTON2 


7 显示 停止 图 标 和 OK 按钮 
INVOKE MessageBox, NULL, ADDR haltMsg, 
ADDR captionH, 
MB OK + MB ICONSTOP 


exit 
main ENDP 
END main 


11.1.4 控制 台 输 入 


到 目前 为 止 ， 本 书 链 接 库 中 的 ReadString 和 ReadChar 过 程 已 经 被 使 用 了 几 次 。 它 们 被 
设计 得 既 简单 又 直接 ， 因 此 程序 员 可 以 专注 于 其 他 的 问题 。 这 两 个 过 程 都 被 封装 在 Win32 
函数 ReadConsole 中 。( 封 装 (wrapper) 过 程 隐藏 了 另 一 个 过 程 的 一 些 细节 。) 

控制 台 输 入 缓冲 区 ”Win32 控制 台 的 输入 缓冲 区 包含 了 一 个 输入 事件 记录 的 数组 。 每 一 
个 输入 事件 ， 诸 如 按键 、 移 动 鼠 标 ， 或 点 击 鼠标 按钮 等 ， 都 会 在 控制 台 输 入 缓冲 区 中 创建 一 
个 输入 记录 。 像 ReadConsole 一 样 的 高 级 输入 函数 对 输入 数据 进行 过 滤 和 处 理 ， 然 后 只 返回 
一 个 字符 流 。 

1. ReadConsole 函数 

函数 ReadConsole 为 读 取 文 本 输入 并 将 其 送 入 缓冲 区 提供 了 便捷 的 方法 。 其 原型 如 下 所 示 : 


ReadConsole PROTO, 
hConsoleInput :HANDLE, ; 输入 句柄 
lpBuffer:PTR BYTE, ; 缓冲 区 指针 


454 
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nNumberofcharsToRead :DWORD, ; 读 取 的 字符 数 
lpNumberOfCharsRead:PTR DWORD, ; 指向 读 取 字 节 数 的 指针 
lpReserved:DWORD 7 未 使 用 


hConsoleInput 是 函数 GetStdHandle 返回 的 可 用 控制 台 输入 句柄 。 参 数 lpBuffer 是 字 
符 数组 的 偏 移 量 。nNumberOfCharsToRead 是 一 个 32 位 整数 ， 指 明 读 取 的 最 大 字符 数 。 
lpNumberOfCharsRead 是 一 个 允许 函数 填充 的 双 字 指针 ， 当 函数 返回 时 ， 字 符 数 的 计数 值 将 
被 放 入 缓冲 区 。 最 后 一 个 参数 未 使 用 ， 因 此 传递 的 值 为 0。 

在 调用 ReadConsole 时 ， 输 入 缓冲 区 还 要 包含 两 个 额外 的 字 节 用 来 保存 行 结束 字符 。 如 
果 希 望 输入 缓冲 区 里 是 空 字 节 结束 字符 串 ， 则 用 空 字 节 来 代替 内 容 为 0Dh 的 字 节 。Irvine32. 
lib 的 过 程 ReadString 就 是 这 样 操 作 的 。 


注意 Win32 API 函数 不 会 保存 EAX、EBX、ECX 和 EDX 寄存 器 。 


示例 程序 ”要 读 取 用 户 输入 的 字符 ， 就 调用 GetStdHandle 来 获得 控制 台 标 准 输入 句柄 ， 
再 使 用 该 句柄 调用 ReadConsole。 下 面 的 ReadConsole 程序 演示 了 这 个 方法 。 注 意 ，Win32 
API 调用 与 Irvine32 链接 库 兼 容 ， 因 此 在 调用 Win32 函数 的 同时 还 可 以 调用 DumpRegs: 

; 从 控制 台 读 取 (ReadConsole.asm) 


INCLUDE Irvine32.inc 
BufSize = 80 


.data 

buffer BYTE BufSize DUP(?),0,0 
stdInHandle HANDLE 3? 

bytesRead DWORD ? 


.code 
main PROC 
; 获得 标准 输入 句柄 
INVOKE GetStdHandle, STD INPUT HANDLE 
mov stdIinHandle,eax 
? 等 待 用 户 输入 
INVOKE ReadConsole, stdInHandle, ADDR buffer, 
BufSize, ADDR bytesRead, 0 
; 显示 缓冲 区 
mov esi,OFFSET buffer 
mov ecx,bytesRead 
mov ebx,TYPE buffer 
call DumpMem 
exit 
main ENDP 
END main 


如 果 用 户 输入 “abcdefg”， 程 序 将 生成 如 下 输出 。 缓 冲 区 会 插入 9 个 字 节 :“abcdefg” 
再 加 上 0Dh 和 0Ah， 即 用 户 按 下 Enter 键 时 产生 的 行 结束 字符 。bytesRead 等 于 9: 


Dump of offset 00404000 





61 62 63 64 65 66 67 0D Oa 


2. 错误 检查 
若 Windows API 函数 返回 了 错误 值 (如 NULL)， 则 可 以 调用 API 函数 GetLastError 来 
获取 该 错误 的 更 多 信息 。 该 函数 用 EAX 返回 32 位 整数 错误 码 : 
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-data 

messageId DWORD ? 

.Code 

Call GetLastError 

mov messageld,eax 


MS-Windows 有 大 量 的 错误 码 ， 因 此 ， 程 序 员 可 能 希望 得 到 一 个 消息 字符 串 来 对 错误 进 
行 说 明 。 要 想 达 到 这 个 目的 ， 就 调用 函数 FormatMessage: 


FormatMessage PROTO, ; 格式 化 消息 
dwFlags :DWORD, ; 格式 化 选项 
lpSource:DWORD, ; 消息 定义 的 位 置 
dwMsgID:DWORD, ; 消息 标识 符 
dwLanguageID:DWORD, ; 语言 标识 符 
lpBuffer:PTR BYTE, ; 缓冲 区 接收 字符 囊 指针 
nSize:DWORD, ; 缓冲 区 大 小 
va_list:DWORD ; 参数 列表 指针 


该 函数 的 参数 有 点 复杂 ， 程 序 员 需 要 阅读 SDK 文档 来 了 解 全 部 信息 。 下 面 简要 列 出 了 
最 常用 的 参数 值 。 除 了 lpBuffer 是 输出 参数 外 ， 其 他 都 是 输入 参数 : 

e dwFlags， 保 存 格式 化 选项 的 双 字 整数 ， 包 括 如 何 解 释 参 数 lpSource。 它 规定 怎 
样 处 理 换行 ， 以 及 格式 化 输出 行 的 最 大 宽度 。 建 议 值 为 FORMAT _ MESSAGE _ 
ALLOCATE BUFFER 和 FORMAT _ MESSAGE FROM _ SYSTEM。 
lpSource， 消 息 定 义 位 置 的 指针 。 若 按照 建议 值 设 置 dwFlags， 则 lpSource 设置 为 
NULL (0 )。 

e@ dwMsgID， 调 用 GetLastError 后 返回 的 双 字 整数 。 

dwLanguageID， 语 言 标 识 符 。 若 将 其 设置 为 0， 则 消息 为 语言 无 关 ， 否 则 将 对 应 于 
用 户 的 默认 语言 环境 。 

lpBuffer (输出 参数 )， 接 收 空 字 节 结 束 消息 字符 串 的 缓冲 区 指针 。 如 果 使 用 了 
FORMAT _ MESSAGE _ALLOCATE BUFFER 选项 ， 则 会 自动 分 配 缓冲 区 。 

nSize， 用 于 指定 一 个 缓冲 区 来 保存 消息 字符 串 。 如 果 dwFlags 使 用 了 上 述 建议 选项 ， 
则 该 参数 可 以 设置 为 0。 

va_list， 数 组 指针 ， 该 数组 包含 了 可 以 插入 到 格式 化 消息 的 值 。 由 于 没有 格式 化 错误 
消息 ， 这 个 参数 可 以 为 NULL (0 )。 

FormatMessage 的 示例 调用 如 下 : 


.data 

messageId DWORD ? 

pErrorMsg DWORD ? ; 指向 错误 消息 

.Code [457 


call GetLastError 

mov messageId,eaxXx 

INVOKE FormatMessage, FORMAT MESSAGE ALLOCATE BUFFER + 5 
FORMAT MESSAGE FROM SYSTEM, NULL, messageID, 0, 
ADDR pErrorMsg, 0, NULL 


调用 FormatMessage 后 ， 再 调用 LocalFree 来 释放 由 FormatMessage 分 配 的 存储 空间 : 


INVOKE LocalFree, pErrorMsg 


WriteWindowsMsg ”Irvine32 链接 库 有 如 下 WriteWindowsMsg 过 程 ， 它 封装 了 消息 处 
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7 接收: 无 


data 
WriteWindowsMsg 1 BYTE "Error ",0 
WriteWindowsMsg 2 BYTE ": ",0 
pErrorMsg DWORD ? ; 指向 错误 消息 
messageId DWORD ? 
.Code 
call GetLastError 
mov messageld,eax 
; 显示 错误 号 。 
mov edx,OFFSET WriteWindowsMsg 1 
call WriteString 
call WriteDec 
mov edx,OFFSET WriteWindowsMsg 2 
call WriteString 


; 获得 相应 的 消息 字符 串 。 


INVOKE FormatMessage, FORMAT MESSAGE ALLOCATE BUFFER + \ 
FORMAT MESSAGE FROM SYSTEM, NULL, messageID, NULL, 
ADDR pErrorMsg, NULL, NULL 


;显示 MS-Windows 生成 的 错误 消息 。 
mOV edx,pErrorMsg 
call WriteString 


; 森 放 错误 消息 字符 串 的 空间 。 
INVOKE LocalFree, pErrorMsg 


ret 
WriteWindowsMsg ENDP 


3. 单字 符 输 入 
控制 台 模式 下 的 单字 符 输 和 有些 复杂 。MS-Windows 为 当前 安装 的 键盘 提供 了 驱动 器 。 
当 一 个 键 被 按 下 时 ， 一 个 8 位 的 扫描 码 (scan code) 就 被 传递 到 计算 机 的 键盘 端口 ， 当 这 
个 键 被 释放 时 ， 就 会 传递 第 二 个 扫描 码 。MS-Windows 利用 设备 驱动 程序 将 扫描 码 转 换 为 
16 位 的 虚拟 键 码 ( virtual-key code)， 即 MS-Windows 定义 的 用 于 标识 按键 用 途 的 与 设备 无 
关 数 值 。MS-Windows 生成 含有 扫描 码 、 虚 拟 键 码 和 其 他 信息 的 消息 。 这 个 消息 放 在 MS- 
Windows 消息 队列 中 ， 并 最 终 进入 当前 执行 程序 线程 (由 控制 台 输入 句柄 标识 )。 如 果 想 要 
进一步 了 解 键盘 输入 过 程 ， 请 参阅 Platform SDK 文档 中 的 About Keyboard Input 主题 。 虚 
拟 键 常数 列表 位 于 本 书 \Examples\ch11 目录 下 的 VirtualKeys.inc 文件 中 。 
Irvine32 键盘 过 程 ”Irvine32 链接 库 由 两 个 相关 过 程 : 
e ReadChar 等 待 键盘 输入 一 个 ASCII 字符， 并 用 AL 返回 该 字符 。 
e ReadKey 过 程 执行 无 等 待 键盘 检查 。 如 果 控 制 台 输 入 缓冲 区 中 没有 等 待 的 按键 ， 则 
零 标志 位 置 1。 如 果 发 现 有 按键 ， 则 零 标志 位 清 零 且 AL 等 于 零 或 ASCII 码 。EAX 
和 EDX 的 高 16 位 被 覆盖 。 
如 果 ReadKey 过 程 中 的 AL 等 于 0， 那 么 用 户 可 能 按 下 了 特殊 键 (功能 键 、 光 标 箭头 
等 )。AH 寄存 器 为 键盘 扫描 码 ， 本 书 封面 内 页 有 键盘 扫描 码 列表 。DX 为 虚拟 键 码 ，EBX 为 
键盘 控制 键 状态 信息 。 表 11-3 为 控制 键 值 列 表 。 调 用 ReadKey 之 后 ， 可 以 用 TEST 指令 检 
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查 各 种 键 值 ReadKey 的 实现 代码 有 些 长 ， 因 此 就 不 在 这 里 展示 了 。 在 本 书 \Examples\Lib32 
文件 夹 下 的 Irvine32.asm 文件 中 可 以 查看 到 该 实现 代码 。 


表 11-3 ”键盘 控制 键 状态 值 
RIGHT_CTRL PRESSED 
[vc | | 


ReadKey 测试 程序 ”下面 是 ReadKey 测试 程序 : 等 待 一 个 按键 ， 然 后 报告 按 下 的 是 否 
为 CapsLock 键 。 如 同 第 5 章 曾 述 的 一 样 ， 程 序 应 考虑 延迟 因素 ,以 便 在 调用 ReadKey 时 留 
出 时 间 让 MS-Windows 处 理 其 消息 循环 : 

; 测试 ReadKey (TestReadkey .asm) 


INCLUDE Irvine32.inc 
INCLUDE Macros.inc 

























CAPSLOCK_ON 
ENHANCED KEY 
LEFT_ALT_PRESSED 
LEFT_CTRL PRESSED 
NUMLOCK_ON 


右 ALT 键 被 按 下 
右 CTRL 键 被 按 下 
SCROLL LOCK 指示 灯亮 
SHIFT 键 被 按 下 












.code 

main PROC 

L1: mov eax,10 ; 消息 处 理 带 来 的 延迟 
call Delay 
call ReadKey ; 等 待 按键 
jz L1 


test ebx,CAPSLOCK ON 


jz L2 
mWrite <"CapsLock is ON",0dh,0ah> 
jmp L3 
L2: mWrite <"CapsLock is OFF",0dh,0ah> 
L3: exit 
main ENDP 
END main 
4. 获得 键盘 状态 


通过 测试 单个 键盘 按键 可 以 发 现 当前 按 下 的 是 哪个 键 。 方 法 是 调用 API 函数 GetKeyState。 


GetKeyState PROTO, nVirtKey :DWORD 


向 该 函数 传递 如 表 11-4 所 示 的 虚拟 键 值 。 测 试 程序 必须 按照 同一 个 表 来 测试 EAX 里 面 
的 返回 值 。 


表 11-4 用 GetKeyState 测试 按键 
按键 EAX 中 被 测试 的 位 
to 。 
Right Menu 15 


459 
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下 面 的 测试 程序 通过 检查 NumLock 键 和 左 Shift 键 的 状态 来 演示 GetKeyState 函数 : 


7 键盘 切换 键 (Keybd .asm) 
INCLUDE Irvine32.inc 

INCLUDE Macros.inc 

; 如 果 当 前 触发 了 切换 键 (CapsLock、NumLock、ScrollLock)， 
7 则 GetKeyState 将 EAX 的 位 0 置 1。 

7 如 果 当 前 按 下 了 特殊 键 ， 则 将 EAX 的 最 高 位 置 1。 

.code 

main PROC 


INVOKE GetKeyState, VK_NUMLOCK 
test al,1 
IF lZero? 
mWwrite <"The NumLock key is ON",0dh,0ah> 
. ENDIF 


INVOKE GetKeyState, VK _ LSHIFT 
test eax,80000000h 
IF !Zero? 
mWrite <"The Left Shift key is currently DOWN" ,0dh,0ah> 
» ENDIF 


exit 
main ENDP 
END main 


11.1.5 ”控制 台 输出 


前 面 的 章节 尽 可 能 地 简化 了 控制 台 输 出 。 回 顾 一 下 第 5 章 ，Irvine32 库 中 的 过 程 
WriteString 只 需要 一 个 参数 ， 即 EAX 中 的 字符 串 偏 移 量 。 实 际 上 ， 它 封装 了 调用 Win32 画 
数 WriteConsole 的 更 多 细节 。 

然而 ， 本 章 将 学 习 如 何 直接 调用 Win32 函数 ， 如 WriteConsole 和 WriteConsoleOutput- 
Character。 直 接 调 用 要 求 了 解 更 多 细节 ， 但 是 它 也 提供 了 比 Irvine32 链接 库 过 程 更 大 的 灵活 性 。 

1. 数据 结构 

有 些 Win32 控制 台 函 数 使 用 的 是 预定 义 的 数据 结构 ， 包 括 COORD 和 SMALL_RECT。 
COORD 结构 包含 的 是 控制 台 屏 幕 缓 冲 区 内 字符 单元 格 的 坐标 。 坐 标 原点 (0，0 ) 位 于 左上 
角 单 元 格 : 


COORD STRUCT 
X WORD ? 
YY WORD 2 

COORD ENDS 


SMALL _ RECT 结构 包含 的 是 矩形 的 左上 角 和 右 下 角 ， 它 指定 控制 台 窗 口中 的 屏幕 缓冲 
区 字符 单元 格 区 域 : 


SMALL RECT STRUCT 
Left WORD 
Top WORD 
Right WORD 
Bottom WORD 
SMALL RECT ENDS 


JU OU 


2. WriteConsole 函数 
函数 WriteConsole 在 控制 台 窗 口 的 当前 光标 所 在 位 置 写 一 个 字符 串 ， 并 将 光标 留 着 字 
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符 串 末尾 右边 的 字符 位 置 上 。 它 按照 标准 ASCII 控制 字符 操作 ， 比 如 制 表 符 、 回 车 和 换行 。 
字符 串 不 一 定 以 空 字 节 结 束 。 函 数 原型 如 下 : 


WriteConsole PROTO, 
hConsoleOutput :HANDLE, 
lpBuffer:PTR BYTE, 
nNumberOfCharsTowrite:DWORD, 
lpNumberOfCharsWritten:PTR DWORD, 
lpReserved:DWORD 


hConsoleOutput 是 控制 台 输 出 流 句 柄 ; lpBuffer 是 输出 字符 数组 的 指针 ; nNumberOf- 
CharsToWrite 是 数组 长 度 ; lpNumberOfCharsWritten 是 函数 返回 时 实际 输出 字符 数量 的 整数 
指针 。 最 后 一 个 参数 未 使 用 ， 因 此 将 其 设置 为 0。 

3. 示例 程序 : Console1 

下 面 的 程序 Consolel.asm 通 过 向 控制 台 窗 口 写 字符 串 演 示 了 函数 GetStdHandle、 


ExitProcess 和 WriteConsole: 


;Win32 控制 台 示 例 #1 {Consolel .asm) 
; 本 程序 调用 如 下 Win32 控制 台子 数 : 

?GetSstdHandle, ExitProcess, WriteConsole 

INCLUDE Irvine32.inc 


data 

endl EQU <0dh,0ah> ; 行 结尾 

message LABEL BYTE 
BYTE “This program is a simple demonstration of" 
BYTE “console mode output, using the GetStdHandle" 
BYTE "and WriteConsole functions,",endl 

messageSize DWORD ($ - message) 


consoleHandle HANDLE 0 ; 标准 输出 设备 句柄 
bytesWritten DWORD ? ; 输出 字 节 数 
.Code 
main PROC 
; 获得 控制 台 输 出 句柄 : 


INVOKE GetStdHandle, STD OUTPUT HANDLE 
mov consoleHandle,eax 


7 向 控制 台 写 一 个 字符 串 : 


INVOKE WriteConsole, ; 控制 台 输 出 句柄 
consoleHandle, ; 字符 串 档 针 
ADDR message, ; 字符 长 度 
messageSize, ; 返回 输出 字 节 数 
ADDR bytesWritten, ; 未 使 用 
0 
INVOKE ExitProcess,0 
main ENDP 
END main 
程序 生成 输出 如 下 所 示 : 


This program is a simple demonstration of console mode output, using 
the GetStdHandie and WriteConsole functions. 
4. WriteConsoleOutputCharacter 函数 


函数 WriteConsoleOutputCharacter 从 指定 位 置 开 始 ， 向 控制 台 屏幕 缓冲 区 的 连续 单元 格 
内 复制 一 组 字符 。 原 型 如 下 : 
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WriteConsoleOutputCharacter PROTO, 


hconsoleOutput :HANDLE, ; 控制 台 输 出 句柄 
lpCharacter:PTR BYTE, ; 缓冲 区 指针 
nLength:DWORD, ; 缓冲 区 大 小 
dwWriteCoord:COORD, ; 第 一 个 单元 格 的 坐标 


lpNumberOfCharsWritten:PTR DWORD ; 输出 计数 器 
如 果 文 本 长 度 超 过 了 一 行 ， 字 符 就 会 输出 到 下 一 行 。 屏 幕 缓冲 区 的 属性 值 不 会 改变 。 如 
果 函 数 不 能 写字 符 、 则 返回 零 。ASCII 码 ， 如 制 表 符 、 回 车 和 换行 ， 会 被 忽略 。 
11.1.6 ” 读 写 文件 


1. CreateFile 函数 


函数 CreateFile 可 以 创建 一 个 新 文件 或 者 打开 一 个 已 有 文件 。 如 果 调 用 成 功 ， 函 数 返回 
打开 文件 的 句柄 ; 和 否则， 返回 特殊 常数 INVALID HANDLE VALUE。 原型 如 下 : 


CreateFile PROTO, ; 创建 新 文件 
lpFilename:PTR BYTE, ; 文件 名 指针 
dwDesiredAccess :DWORD, ; 访问 模式 
dwShareMode : DWORD, ; 共享 模式 
lpSecurityAttributes :DWORD, ; 安全 属性 指针 
dwCreationDisposition:DWORD,， ;文件 创建 选项 
dwFlagsAndAttributes:DWORD, ; 文件 属性 
hTemplateFile:DWORD ; 文件 模板 句柄 


表 11-5 对 参数 进行 了 说 明 。 如 果 函 数 调用 失败 则 返回 值 为 零 。 
表 11-5 ”CreatFile 参数 


参数 说 明 
lpFileName 指向 - -个 空 字 节 结束 字符 串 ， 该 串 为 部 分 或 全 部 合格 的 文件 名 (drive: \path\filename) 
dwDesiredAccess 指定 文件 访问 方式 ( 读 或 写 ) 
dwShareMode 控制 多 个 程序 对 打开 文件 的 访问 能 力 


lpSecurityAttributes 指向 安全 结构 ， 该 结构 控制 安全 权限 
dwCreationDisposition | ”指定 文件 存在 或 不 存在 时 的 操作 
dwFlagsAndAttributes | ”包含 位 标志 指定 文件 属性 、 如 存档、 加 密 、 隐 藏 、 普 通 、 系 统 和 临时 

包含 一 个 可 选 的 文件 模板 句柄 ， 该 文件 为 已 创建 的 文件 提供 文件 属性 和 扩展 属性 ; 如 果 不 
使 用 该 参数 ， 就 将 其 设置 为 0 

dwDesiredAccess 参数 dwDesiredAccess 允许 指定 对 文件 进行 读 访问 、 写 访问 、 读 / 
写 访 问 ， 或 者 设备 查询 访问 。 可 以 从 表 11-6 列 出 的 值 中 选择 ， 也 可 以 从 表 中 未 列 出 的 更 多 
特定 标志 值 选择 。( 请 在 Platform SDK 文档 中 搜索 CreatFile ) 。 
表 11-6 dwDesiredAccess 参数 选项 


hTemplateFile 


值 含义 
为 对 象 指定 设备 查询 访问 。 应 用 程序 可 以 查询 设备 属性 而 无 需 访问 设备 ， 也 可 以 检查 文件 是 
否 存 在 
为 对 象 指定 读 访问 。 可 以 从 文件 中 读 取 数据 ， 文 件 指针 可 以 移动 。 与 GENERIC_WRITE 一 起 
GENERIC READ 使 用 为 读 / 写 访问 
对 对 象 指定 写 访问 。 可 以 向 文件 中 写 和 数据， 文件 指针 可 以 移动 。 与 GENERIC_READ 一 起 
GENERIC_WRITE | 使 用 为 读 / 写 访问 


dwCreationDisposition ”参数 dwCreationDisposition 指定 当 文 件 存 在 或 不 存在 时 应 采 
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取 怎 样 的 操作 。 可 从 表 11-7 中 选择 一 个 值 . 
表 11-7 dwCreationDisposition 参数 选项 
值 含义 
CREATE NEW 创建 一 个 新 文件 ， 要 求 将 参数 dwDesiredAccess 设置 为 GENERIC_WRITE。 如 果 文 件 已 


经 存在 ， 则 函数 调用 失败 


创建 一 个 新 文件 。 如 果 文 件 已 存在 ， 则 函数 会 覆盖 原文 件 ， 清 除 现 有 属性 ， 并 合并 文件 
属性 与 预定 义 的 常数 FILE_ATTRIBUTES_ARCHIVE 中 属性 参数 指定 的 标志 。 要 求 将 参数 
dwDesiredAccess 设置 为 GENERIC_WRITE 


OPEN_EXISTING 打开 文件 。 如 果 文 件 不 存在 ， 则 函数 调用 失败 。 可 用 于 读 取 和 /或 写 入 文件 


ER 如 果 文 件 存在 ， 则 打开 文件 。 如 果 不 存在 ， 则 函数 创建 文件 ， 就 好 像 CreateDisposition 
的 值 为 CREATE_NEW 


打开 文件 。 一 旦 打开 ， 文 件 将 被 截断 ， 使 其 大 小 为 零 。 要 求 将 参数 dwDesiredAccess 设 
SAT Se 置 为 GENERIC_WRITE。 如 果 文 件 不 存在 ， 则 肾 数 调用 失败 
表 11-8 列 出 了 参数 dwFlagsAndAttributes 比较 常用 的 值 。( 完 整 列表 请 在 Microsoft 在 线 
文档 中 搜索 CreateFile。,) 允许 任意 属性 组 合 ， 除 了 FILE_ATTRIBUTE_NORMAL 会 被 其 他 
所 有 属性 覆盖 。 这 些 值 能 映射 为 2 的 寡 ， 因 此 可 以 用 汇编 时 OR 运算 符 或 + 运算 符 将 它们 组 
合 为 一 个 参数 : 


FILE ATTRIBUTE HIDDEN OR FILE ATTRIBUTE READONLY 
FILE ATTRIBUTE HIDDEN + FILE ATTRIBUTE READONLY 


CREATE ALWAYS 


表 11-8 FlagsAndAttributes 值 节选 


属性 含义 
FILE_ATTRIBUTE ARCHIVE 文件 存档 。 应 用 程序 使 用 这 个 属性 标记 文件 以 便 备 份 或 移动 
FILE_ATTRIBUTE_HIDDEN 文件 隐藏 。 不 包含 在 普通 目录 列表 中 
FILE_ATTRIBUTE_NORMAL 文件 没有 其 他 属性 设置 。 该 属性 只 在 单独 使 用 时 有 效 
FILE_ATTRIBUTE READONLY 文件 只 读 。 应 用 程序 可 以 读 文 件 但 不 能 写 或 删除 文件 
FILE_ATTRIBUTE TEMPORARY 文件 被 用 于 临时 存储 


示例 ”下面 的 例子 仅 具 说 明 性 ， 展 示 了 如 何 创建 和 打开 文件 。 请 参阅 在 线 Microsoft 文 
档 ， 了 解 CreateFile 更 多 可 用 选项 : 


。 打开 并 读 取 (输入 ) 已 存在 文件 : 


INVOKE CreateFile, 


RDDR filename， ; 文件 名 指针 
GENERIC READ, ; 读 文 件 
DO_NOT_SHARE, ; 共享 模式 
NULL, ; 安全 属性 指针 
OPEN_ EXISTING, ; 打开 已 存在 文件 
FILE ATTRIBUTE NORMAL, ; 普通 文件 属性 

0 ; 未 使 用 


。 打开 并 写 人 (输出 ) 已 存在 文件 。 文 件 打开 后 ， 可 以 通过 写 人 覆盖 当前 数据 ， 或 者 将 
文件 指针 移 到 末尾 ， 向 文件 添加 新 数据 (参见 11.1.6 节 的 SetFilePointer): 


INVOKE CreateFile, 
ADDR filename, 
GENERIC WRITE, 
DO_NOT_SHARE, 
NULL, 


nn 


文件 
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OPEN EXISTING, 


筑 11 曹 


; 文件 必须 存在 


FILE ATTRIBUTE NORMAL, 


0 


e 创建 有 普通 属性 的 新 文件 


INVOKE CreaterFile, 
ADDR filename, 
GENERIC WRITE, 
DO_NOT_ SHARE， 
NULL, 

CREATE ALWAYS, 


， 并 删除 所 有 已 存在 的 同名 文件 : 


? 写 文 件 


;覆盖 已 存在 的 文件 


FILE ATTRIBUTE NORMAL, 


0 


e 若 文 件 不 存在 ， 则 创建 文件 ; 否则 打开 并 输出 现 有 文件 : ， 


INVOKE CreateFile， 
ADDR filename, 
GENERIC WRITE, 
DO_NOT_SHARE, 
NULL, 
CREATE _ NEW, 


? 写 文件 


; 不 删除 已 存在 文件 


FILE ATTRIBUTE NORMAL, 


0 


(常数 DO_NOT_SHARE 和 NULL 在 文件 SmallWin.inc 中 进行 了 定义 ,该 文件 自动 包含 


在 Irvine32.inc 中 。) 
2. CloseHandle 函数 


函数 CloseHandle 关闭 一 个 打开 的 对 象 句柄 。 其 原型 如 下 : 


CloseHandle PROTO, 
hObject : HANDLE 


7 对 象 句柄 


可 以 用 CloseHandle 关闭 当前 打开 的 文件 句柄 。 如 果 函 数 调用 失败 ， 则 返回 值 为 零 。 


3. ReadFile 函数 


函数 ReadFile 从 输入 文件 中 读 取 文本 。 其 原型 如 下 : 


ReadFile PROTO, 
hFile:HANDLE, 
lpBuffer:PTR BYTE, 


nNumberOfBytesToRead:DWORD, 
lpNumberOfBytesRead:PTR DWORD, 
lpOverlapped:PTR DWORD 


; 输入 句柄 

7 缓冲 区 指针 

; 读 取 的 字 节 数 

; 实际 读 出 的 字 节 数 
7 异步 信息 指针 


参数 hFile 是 由 CreateFile 返回 的 打开 文件 的 句柄 ; lpBuffer 指向 的 缓冲 区 接收 从 该 文件 读 
取 的 数据 ; nNumberOfBytesToRead 定义 从 该 文件 读 取 的 最 大 字 节 数 ; lpNumberOfBytesRead 指 
向 的 整数 为 函数 返回 时 实际 读 取 的 字 节 数 ; 若 为 同步 读 (本 书 使 用 ) 则 lpOverlapped 应 被 设 
置 为 NULL (0)。 若 函数 调用 失败 ， 则 返回 值 为 零 。 

如 果 对 同一 个 打开 文件 的 句柄 进行 多 次 调用 ， 那 么 ReadFile 就 会 记 住 最 后 一 次 读 取 


的 位 置 ， 并 从 这 个 位 置 开始 读 。 


换 名 话说， 函数 有 一 个 内 部 指针 指向 文件 内 的 当前 位 置 。 


ReadFile 还 可 以 运行 在 异步 模式 下 ， 这 意味 着 调用 程序 不 用 等 到 读 操作 完成 。 


4. WriteFile 函数 


函数 WriteFile 用 输出 句柄 向 文件 写 和 数据。 句柄 可 以 是 屏幕 缓冲 区 句柄 ， 也 可 以 是 分 
配给 文本 文件 的 句柄 。 函 数 从 文件 内 部 位 置 指 针 所 指向 的 位 置 开 始 写 数据 。 写 操作 完成 后 ， 


JMS-Windows 编程 371 





文件 位 置 指针 按照 实际 写 人 的 字 节 数 进行 调整 。 函 数 原型 如 下 : 


WriteFile PROTO, 


hFile:HANDLE, ; 输出 句柄 
lpBuffer:PTR BYTE, ; 缓冲 区 指针 
nNumberOfBytesToWrite:DWORD, ; 缓冲 区 大 小 
lpNumberOfBytesWritten:PTR DWORD, ; 写 入 字 节 数 
lpOverlapped:PTR DWORD ; 异步 信息 指针 


hFile 是 已 打开 文件 的 句柄 ; lpBuffer 指 向 的 缓冲 区 包含 了 写 人 到 文件 的 数据 ; 
nNumberOfBytetToWrite 指定 向 文件 写 人 多 少 字 节 ; ljpNumberOfBytesWritten 指向 的 整数 为 
函数 执行 后 实际 写 入 的 字 节 数 ; 若 为 同步 操作 ， 则 lpOverlapped 应 被 设置 为 NULL。 若 函数 
调用 失败 ， 则 返回 值 为 零 。 

5. SetFilePointer 函数 

函数 SetFilePointer 移动 打开 文件 的 位 置 指 针 。 该 函数 可 以 用 于 向 文件 添加 数据 ， 或 是 
执行 随机 访问 记录 处 理 : 


SetFilePointer PROTO, 
hFile:HANDLE, ; 文件 句柄 
lDistanceToMove:SDWORD, ; 指针 移动 字 节 数 


lpDistanceToMoveHigh:PTR SDWORD， ; 指针 移动 字 节 数 ， 高 双 字 
dwMoveMethod:DWORD » 


车 函数 调用 失败 ， 则 返回 值 为 零 。dwMoveMode 指定 文件 指针 移动 的 起 点 ， 选 择 项 为 3 
个 预定 义 符号 : FILE_BEGIN、FILE_CURRENT 和 FILE_END。 移动 距离 本 身 为 64 位 有 符 
号 整数 值 ， 分 为 两 个 部 分 : 

e@ lpDistanceToMove: 低 32 位 

e lpDistanceToMoveHigh: 含有 高 32 位 的 变量 指针 

如 果 lpDistanceToMoveHigh 为 空 ， 则 只 用 lpDistanceToMove 的 值 来 移动 文件 指针 。 例 
如 ， 下面 的 代码 准备 添加 到 一 个 文件 未 尾 : 


INVOKE SetFilePointer, 


’ 


fileHandle, ; 文件 句柄 

0， ; 距离 低 32 位 

Oa ;距离 高 32 位 

FILE END ; 移动 模式 
参见 程序 AppendFile.asm。 


11.1.7 _ Irvine32 链接 库 的 文件 |/O 


Irvine32 库 中 包含 了 一 些 简化 的 文件 IO 过 程 ， 第 5 章 介绍 过 它们 。 这 些 过 程 已 经 封 
装 到 本 章 描述 的 Win32 API 函数 中 。 下 面 的 源 代 码 就 给 出 了 CreateOutputFile 、OpenFile、 
WriteToFile 、ReadFromFile 和 CloseFile: 


CreateOutputFile PROC 


; 创建 一 个 新 文件 并 以 输出 模式 打开 。 

; 接收 : EDX 指向 文件 名 。 

; 返回 : 如 果 文件 创建 成 功 ，ERX 包含 一 个 有 效 的 文件 句柄 。 
7 否则 ，EAX 等 于 INVALID HANDLE VALUE, 


INVOKE CreateFile, 
edx, GENERIC WRITE, DO_ NOT SHARE, NULL, 
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CREATE ALWAYS, FILE ATTRIBUTE NORMAL, 0 
ret 
CreateOutputFile ENDP 


OpenFile PROC 


; 打开 一 个 新 的 文本 文件 进行 输入 。 

? 接收 : EDX 指向 文件 名 。 

;? 返回 ; 如 果 文 件 打 开 成 功 ，EAX 包含 一 个 有 效 的 文件 
7 句柄 。 否 则 ，ERX 等 于 INVALID_HANDLE_VALUE。 


INVOKE CreateFile， 


468 edx, GENERIC READ, DO_NOT SHARE, NULL, 
OPEN EXISTING, FILE ATTRIBUTE NORMAL, 0 
ret 


OpenFile ENDP 


WriteToFile PROC 


; 将 缓冲 区 内 容 写 入 一 个 输出 文件 。 

; 接收 : EAX= 文件 句柄 ，EDX= 缓冲 区 偏 移 量 ，ECX= 写 入 字 节 数 
; 返回 : EAX= 实际 写 入 文件 的 字 节 数 。 

; 如 果 EAX 返回 的 值 小 于 ECX 中 的 参数 ， 则 可 能 发 生 错误 。 


.data 
WriteToFile 1 DWORD ? ; 已 写 入 字 节 效 
.Code 
INVOKE WriteFile, ; 向 文件 写 缓冲 区 
eax, ? 文件 句柄 
edx, ; 缓冲 区 指针 
ecx, ; 写 入 字 节 数 
ADDR WriteToFile 1， ; 已 写 入 字 节 数 
0 ; 覆盖 执行 标志 
mov eax,WriteTorFile 1 ; 返回 值 
ret 


WriteToFile ENDP 


ReadFromFile PROC 

; 将 一 个 输入 文件 读 入 缓冲 区 。 

; 接收 : EAX= 文件 句柄 ，EDX= 缓冲 区 偏 移 量 ，ECX= 读 字 节 数 

; 返回 : 如 果 CF=0，EAX= 已 读 字 节 数 ; 如 果 CE=1， 则 EAX 包含 Win32 API 函 
; 数 GetLastError 返回 的 系统 错误 码 。 


.data 
ReadFromFile 1 DWORD ? ; 已 读 字 节 数 
.Code 
INVOKE ReadFile, 
eax, ;? 文件 句柄 
edx, ; 缓冲 区 指针 
ecx, ; 读 取 的 最 大 字 节 数 
ADDR ReadFromFile 1, ; 已 读 字 节 数 
0 ; 覆盖 执行 标志 
mov eax,ReadFromFile 1 
ret 


ReadFromFile ENDP 


CloseFile PROC 


MS-Windows 编程 373 





; 使 用 句柄 为 标识 符 关 闭 一 个 文件 。 

; 接收 : EAX= 文件 句柄 

; 返回 : EAX= 非 0， 如 果 文 件 被 成 功 关 闭 
INVOKE Closefancle, eax 
ret 

CloseFile ENDP 


11.1.8 测试 文件 I/O 过 程 


1. CreatFile 程序 示例 
下 面 的 程序 用 输出 模式 创建 一 个 文件 ， 要 求 用 户 输入 一 些 文本 ， 将 这 些 文本 写 到 输出 文 


件 ， 并 报告 已 写 人 的 字 节 数 ， 然 后 关闭 文件 。 在 试图 创建 文件 后 ， 程 序 要 进行 错误 检查 : 


; 创建 一 个 文件 (CreateFile.asm) 
INCLUDE Irvine32.inc 
BUFFER SIZE = 501 


.data 
buffer BYTE BUFFER SIZE DUP(?) 
filename BYTE “output.txt",0 


fileHandle HANDLE ? 

stringLength DWORD ? 

bytesWritten DWORD ? 

strl BYTE "Cannot create file",0dh,0ah,0 

str2 BYTE "Bytes written to file [output.txt]:",0 

str3 BYTE "Enter up to 500 characters and press" 
BYTE "[Enter]: "0dh,0ah,0 


.code 

main PROC 

; 创建 一 个 新 文本 文件 - 
mov edx,OFFSET filename 
call CreateOutputFile 
mov fileHandle,eax 


; 错误 检查 。 
cmp eax, INVALID HANDLE VALUE ; 发 现 错误 ? 
jne file ok ; 和 否 ， 跳 过 
mov edx,OFFSET strl ; 显示 错误 
call Writestring 
jmp quit 

file ok: 

; 提示 用 户 输入 字符 串 。 
mov edx,OFFSET str3 “Bnter up tO asss 
call Writestring 
mov ecx,BUFFER SIZE ; 输入 字符 串 


mov edx,OFFSET buffer 

call ReadString 

mov stringLength,eax ; 计算 输入 字符 数 
; 将 缓冲 区 写 入 输出 文件 。 

mov eax,fileHandle 

mov edx,OFFSET buffer 

mov ecx,stringLength 

call WriteToFile 

mov bytesWwritten,eax ; 保存 返回 值 

call CloseFile 
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; 显示 返回 值 
mov edx,OFFSET str2 ; "Bytes written" 
call WriteString 
mov eax,byteswritten 
call WriteDec 
call TrLlE 


quit: 
exit 

main ENDP 

END main 


2. ReadFile 程序 示例 
下 面 的 程序 打开 一 个 文件 进行 输入 ,将 文件 内 容 读 入 缓冲 区 ， 


程 都 从 Irvine32 链接 库 调 用 : 


; 读 文件 (ReadFile.asm) 


; 使 用 Irvine32.1ib 的 过 程 打开 ， 读 取 并 显示 一 个 文本 文件 。 
INCLUDE Irvine32 .inc 

INCLUDE macros.inc 

BUFFER SIZE = 5000 


.data 

buffer BYTE BUFFER _ SIZE DUP(?) 
filename BYTE 80 DUP(0) 
fileHandle HANDLE ? 


.Code 
main PROC 
; 用 户 输入 文件 名 - 
IIWrite "Enter an input filename: ” 
mov edx,OFFSET filename 
mov ecx,SIZEOF filename 
call ReadString 


;? 打开 文件 进行 输入 。 
mov edx,OFFSET filename 
call OpenInputFile 
mov fileHandle,eax 


; 错误 检查 。 
cmp eax,INVALID HANDLE VALUE ; 错误 打开 文件 ? 
jne file ok ; 否 : 跳 过 
mWrite <"Cannot open file",0dh,0ah> 
jmp quit ; 退出 

file ok: 

; 将 文件 读 入 缓冲 区 。 


mov edx,OFFSET buffer 

mov ecx,BUFFER SIZE 

call ReadFromFile 

jnc check buffer size ; 错误 读 取 ? 
mNrite "Error reading file. " ; 是 : 显示 错误 消息 
call WriteWwindowsMsg 

jmp close file 


Check buffer size: 
cmp eax,BUFFER SIZE ; 缓冲 区 足够 大 ? 
jb buf_size ok 


第 11 呈 


并 显示 该 缓冲 区 。 所 有 过 


mWrite <"Error: Buffer too small for the file",0dh,0ah> 


jmp quit ;退出 
buf_ size ok: 
mov buffer[leax],0 ; 插入 空 结束 符 


MS-Windows 编程 375 





mWrite "File size; 
call WriteDec ; 显示 文件 大 小 
call Crit 

; 显示 缓冲 区 。 
ImNrite <" Buffer:",0dh,0ah,0dh,0ah> 
mov edx,OFFSET buffer ; 显示 缓冲 区 
call WriteStIring 
Call Celif 


close file: 
mov eax,fileHandle 
call CloseFile 
quit: 
exit 
main ENDP 
END main 


如 果 文 件 不 能 打开 ， 则 程序 报告 错误 : 


Enter an input filename: crazy.txt 
Cannot open file 


如 果 程序 不 能 从 文件 读 取 ， 则 报告 错误 。 比 如 ,假设 有 一 个 错误 为 在 读 文 件 时 使 用 了 不 
正确 的 文件 句柄 : 


Enter an input filename: infile.txt 


Error reading file. Error 6: The handle is invalid. 


缓冲 区 可 能 太 小 ， 无 法 容纳 文件 : 


Enter an input filename: infile.txt 
Error: Buffer too small for the file 
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11.1.9 控制 人 台 窗 口 操作 


Win32 API 提供 了 对 控制 台 窗口 及 其 缓冲 区 相当 大 的 控制 权 。 图 11-1 显示 了 屏幕 缓冲 
区 可 以 大 于 控制 台 窗口 当前 显示 的 行 数 。 控 制 台 窗口 就 像 是 一 个 “视窗 "， 显 示 部 分 缓冲 区 。 
活 牙 屏幕 缓冲 区 

















PXt text text text text text text text text 
text text text text text text text text text 
text text text text text text text text text 
text text text text text text text text text 
text text text text text 下 

控制 台 窗 口 ext text text text text 下 
text text text text text 
text text text text text 
text text text text text 
text text text text text £ 

text text text text text text text text text 
text text text text text text text text text 
text text text text text text texttext text 
text toxt text text text text text text text 
text text text text text text text text text 
text text text text text text text text text 


11-1 屏幕 缓冲 区 和 控制 台 窗口 
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下 列 函 数 影响 的 是 控制 台 窗 口 及 其 相对 于 屏幕 缓冲 区 的 位 置 : 
e@ SetConsoleWindowInfo 设置 控制 台 窗口 相对 于 屏幕 缓冲 区 的 大 小 和 位 置 。 


e@ GetConsoleScreenBufferInfo 返回 (还 包括 其 他 一 些 信 息 ) 控制 台 窗 口 相 对 于 屏幕 组 


冲 区 的 矩形 坐标 。 


则 移动 控制 台 窗 口 直到 光标 可 见 。 


台 窗 口 显 示 的 文本 。 
1. SetConsoleTitle 
函数 SetConsoleTitle 可 以 改变 控制 台 和 窗口 的 标题 。 示 例如 下 : 


.data 

titlestr BYTE "Console title",0 

.Code 

INVOKE SetConsoleTitle, ADDR tit1leStr 


2. GetConsoleScreenBufferlnfo 
函数 GetConsoleScreenBufferInfo 返回 控制 台 窗 口 的 当前 状态 信息 。 它 有 两 个 参数 : 
制 台 屏 幕 的 句柄 和 指向 该 函数 填充 的 结构 的 指针 : 


GetConsoleScreenBufferIinfo PROTO, 
hConsoleOutput :HANDLE, 
lpConsoleScreenBufferInfo:;PTR CONSOLE SCREEN BUFFER_INFO 


CONSOLE_SCREEN_BUFFER_INFO 结构 如 下 : 
CONSOLE SCREEN BUFFER_INFO STRUCT 


dwSize COORD <> 
dwCursorPosition COORD <> 
wAttributes WORD ? 
srWindow SMALL RECT <> 


dwMaximumWwindowSize COORD <> 
CONSOLE SCREEN BUFFER INFO ENDS 


dwSize 按 字符 行列 数 返 回 屏幕 缓冲 区 大 小 。dwCursorPosition 返回 光标 的 位 置 。 这 两 个 
字段 都 是 COORD 结构 。wAttributes 返回 字符 的 前 景色 和 背景 色 ， 字 符 由 诸如 WriteConsole 
和 WriteFile 等 函数 写 到 控制 台 。srWindow 返回 控制 台 窗 口 相 对 于 屏幕 缓冲 区 的 坐标 。 
drMaximumWindowSize 以 当前 屏幕 缓冲 区 的 大 小 、 字 体 和 视频 显示 大 小 为 基础 ， 返 回 控制 


台 窗 口 的 最 大 尺寸 。 函 数 示例 调用 如 下 所 示 : 


.data 

consoleInfo CONSOLE SCREEN BUFFER INFO <> 

outHandle HANDLE ? 

.Code 

INVOKE GetConsoleScreenBufferIinfo, outHandle, 
ADDR consoleInfo 


图 11-2 为 Microsoft Visual Studio 调试 器 展示 的 结构 数据 示例 。 
3. SetConsoleWindowlnfo 函数 


函数 SetConsoleWindowInfo 可 以 设置 控制 台 窗 口 相对 于 其 屏幕 缓冲 区 的 大 小 和 位 置 。 


函数 原型 如 下 : 


SetConsoleCursorPosition 将 光标 设置 在 屏幕 缓冲 区 内 的 任何 位 置 ; 如 果 区 域 不 可 见 ， 


ScrollConsoleScreenBuffer 移动 屏幕 缓冲 区 中 的 一 些 或 全 部 文本 ， 本 了 哺 数 会 影响 控制 
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Name Valye 


Type A 
器 corsoleinfc 1dw5ize={x=Dx0078 Y=0 0032 } dwcursorposibon= CON5OLE_5CREEN_BUFFER_INFO 

器 dwsee 1X=0x0078 Y=0x0032 } COORD 

x 0x0078 unsigned short 

Y Urr0032 unsigned short 
器 dwCursorPosion X=0x0014 Y=Dx0on00S } COORD 

和 {hx0014 unsigned short 

Y Ux0005 unsigned Short 

wattributes 0x0007 unsigned short 


{Left=0xQ000 Top=0x0000 Right=DxD04F 


图 11-2 CONSOLE_SCREEN_BUFFER_INFO 结构 


SetConsoleWindowInfo PROTO, 
hconsoleOutput :HANDLE， ; 屏幕 缓冲 区 句柄 
bAbsolute:DWORD, ; 坐标 类 型 
lpConsoleWindow:PTR SMALL RECT ,和 矩形 窗口 指针 


bAbsolute 说 明 如 何 使 用 结构 中 由 lpConsoleWindow 指出 的 坐标 。 如 果 bAbsolute 为 真 ， 

则 坐标 定义 控制 台 窗 口 新 的 左上 角 和 右 下 角 。 如 果 bAbsolute 为 假 ， 则 坐标 与 当前 窗口 坐标 

相 加 。 474 
下 面 的 Scroll.asm 程序 向 屏幕 缓冲 区 写 50 行文 本。 然后 重 定义 控制 台 窗 口 的 大 小 和 位 

置 ， 有 效 地 向 后 滚动 文本 ,， 该 程序 使 用 了 郧 数 SetConsoleWindowInfo : 


; 滚动 控制 台 窗 口 (Scroll.asm) 
INCLUDE Irvine32.inc 





.data 

message BYTE ": This line of text was written " 
BYTE "to the screen buffer",0dh,0ah 

messageSize DWORD ($-message) 


outHandle HANDLE 0 ; 标准 输出 句柄 
bytesWritten DWORD ? ; 已 写 入 字 节 教 
lineNum DWORD 0 

windowRect SMALL RECT <0,0,60,11>  ; 堪 , 上, 右 , 下 
.Code 

main PROC 


INVOKE GetStdHandle, STD OUTPUT HANDLE 
mov outHandle,eax 


REPEAT 

mov eax, lineNum 

call WriteDec ; 显示 每 行 编号 

INVOKE WriteConsole, 
outHandle, ; 控制 台 输出 句柄 
ADDR message, ; 字符 串 指 针 
messageSize, ; 字符 串 长 度 
ADDR bytesWritten, ; 返回 已 写字 节 数 

We ; 未 使 用 

inc lineNum ; 下 一 行 编号 


.UNTIL lineNum > 50 475 
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; 调整 控制 台 窗 口 相对 于 屏幕 缓冲 区 的 大 小 和 位 置 。 
INVOKE SetConsoleWindowInfo, 
outHandle, 
TRUE, 
ADDR windowRect ; 窗口 矩形 


call Readchar ; 等 待 按键 


call Clrscr ; 清除 屏幕 缓冲 区 
call Readchar ; 等 待 第 二 次 按键 


INVOKE ExitProcess,0 
main ENDP 
END main 


最 好 能 直接 从 MS-Windows Exlporer 中 ， 或 者 直接 以 命令 行 形式 运行 程序 ， 而 不 使 用 集 
成 的 编辑 环境 。 否 则 ， 编 辑 器 可 能 会 影响 控制 台 窗口 的 行为 和 外 观 。 在 程序 结束 时 需要 两 次 
按键 : 第 一 次 清除 屏幕 缓冲 区 ， 第 二 次 结束 程序 。 

4. SetConsoleScreenBufferSize 函数 

函数 SetConsoleScreenBufferSize 可 以 将 屏幕 缓冲 区 设置 为 X 列 xY 行 。 其 原型 如 下 : 


SetConsoleScreenBufterSize PROTO， 
hConsoleOutput :HRNDLE， ; 屏幕 缓冲 区 句柄 
dwSize:COORD ;新 屏幕 缓冲 区 大 小 


11.1.10 ”控制 光标 


Win32 API 提供 了 函数 用 于 设置 光标 的 大 小 、 可 见 度 和 屏幕 位 置 。 与 这 些 函 数 相 关 的 重 
要 数据 结构 是 CONSOLE_CURSOR _INFO， 其 中 包含 了 控制 台 光 标的 大 小 和 可 见 度 信息 : 


CONSOLE CURSOR INFO STRUCT 
dwSize DWORD ? 
bVisible DWORD ? 

CONSOLE CURSOR INFO ENDS 


dwSize 为 光标 填充 的 字符 单元 格 的 百分比 (从 1 到 100 )。 如 果 光 标 可 见 ， 则 bVisible 
等 于 TRUE (1)。 

1. GetConsoleCursorlnfo 函数 

函数 GetConsoleCursorInfo 返回 控制 台 光 标的 大 小 和 可 见 度 。 需 向 其 传递 指向 结构 
CONSOLE CURSOR _INEFO 的 指针 : 


GetConsoleCursorInfo PROTO, 
hConsoleOutput :HANDLE, 
lpConsoleCursorIinfo:PTR CONSOLE CURSOR_INFO 


默认 情况 下 ， 光 标 大 小 为 25， 这 表示 光标 占据 了 25% 的 字符 单元 格 。 

2. SetConsoleCursorlnfo 函数 

函数 SetConsoleCursorInfo 设置 光标 的 大 小 和 可 见 度 。 需 向 其 传递 指向 结构 CONSOLE 
CURSOR_INFO 的 指针 : 


SetConsoleCursorInfo PROTO, 
hConsoleOutput : HANDLE, 
lpConsoleCursorIinfo:PTR CONSOLE CURSOR _ INFO 

3. SetConsoleCursorPosition 


函数 SetConsoleCursorPosition 设置 光标 的 X、Y 位 置 。 向 其 传递 一 个 COORD 结构 和 
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控制 台 输 出 句柄 : 
SetConsoleCursorPosition PROTO, 
hcConsoleOutput :DWORD, ; 输入 模式 句柄 
dwCursorPosition:COORD ; 屏幕 X、Y 坐标 


11.1.11 ”控制 文本 颜色 


控制 台 窗 口中 的 文本 颜色 有 两 种 控制 方法 。 一 种 方法 是 通过 调用 SetConsoleTextAttribute 
来 改变 当前 文本 颜色 ， 这 种 方法 会 影响 控制 台中 所 有 后 续 输 出 文本 。 另 一 种 方法 是 调用 
WriteConsoleOutputAttribute 来 设置 指定 单元 格 的 属性 。 函 数 GetConsoleScreenBufferInfo (参见 
11.1.9 节 ) 返回 当前 屏幕 的 颜色 以 及 其 他 控制 台 信息 。 

1. SetConsoleTextAttribute 函数 

函数 SetConsoleTextAttribute 可 以 设置 控制 台 窗 口 所 有 后 续 输 出 文本 的 前 景色 和 背景 
色 。 原 型 如 下 : 


SetConsoleTextAttribute PROTO, 
hconsoleOutput :HANDLE, ; 控制 台 输 出 句柄 
wAttributes :WORD ; 颜色 属性 


颜色 值 保 存在 wAttributes 参数 的 低 字 节 中 。 

2. WriteConsoleOutputAttribute 函数 

函数 WriteConsoleOutputAttribute 从 指定 位 置 开 始 ， 向 控制 台 屏 幕 缓冲 区 的 连续 单元 格 
复制 一 组 属性 值 。 原 型 如 下 : 


WriteConsoleOutputAttribute PROTO, 


hconsoleOutput :DWORD, ; 输出 句柄 
lpAttribute:PTR WORD, ; 写 属性 

nLength :DWORD, ;单元 格 数 
dwWriteCoord:COORD, ; 第 一 个 单元 格 坐 标 


lpNumberOfAttrsWritten:PTR DWORD  ; 输出 计数 


lpAttribute 指向 属性 数组 ， 其 中 每 个 字 节 的 低 字 节 都 包含 了 颜色 值 ，nLength 为 数组 长 
度 ; dwWriteCoord 为 接收 属性 的 开始 屏幕 单元 格 ; lIpNumberOfAttrsWritten 指向 一 个 变量 ， 
其 中 保存 的 是 已 写 单元 格 的 数量 。 

3. 示例 : 写 文 本 颜色 

为 了 演示 颜色 和 属性 的 用 法 ， 程 序 WriteColors.asm 创建 了 一 个 字符 数组 和 一 个 属性 数组 ， 
属性 数组 中 的 每 个 元 素 都 对 应 一 个 字符 。 程 序 调 用 WriteConsoleOutputAttribute 将 属性 复制 到 
屏幕 缓冲 区 ， 调 用 WriteConsoleOutputCharacter 将 字符 复制 到 相同 的 屏幕 缓冲 区 单元 格 : 


; 写 文本 颜色 (WriteColors.asm) 

INCLUDE Irvine32.inc 

.data 

outHandle HANDLE ? 

cellsWwritten DWORD ? 

xyPos COORD <10,2> 

; 字符 编号 数组 : 

Duffer BYTE 12.3d4y3.677 .837.910.117l127 13714r15 
BYTE 16,17,18,19,20 

BufSize DWORD (S$-buffer) 
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; 属性 数组 : 
attributes WORD 0Fh,0Eh,0Dh,0ch,0Bh,0RAh,9,8,7,6 
WORD 5,4,3,2,1,0F0h,0EO0h,0ODOh, oOCOh,0BOh 
.Code 
main PROC 
; 获取 控制 台 标准 输出 句柄 : 
INVOKE GetSstdHandle,SsTD OUTPUT HANDLE 
mov outHandle,eax 
; 设置 相 邻 单元 格 颜色 : 
INVOKE WriteConsoleOutputAttribute, 
outHandle, ADDR attributes, 
BufSize, xyPos, ADDR cellsWritten 
; 写 1 到 20 号 字符 : 
INVOKE WriteConsoleOutputCharacter, 
outHandle, ADDR buffer, BufSize, 
xXyPos, ADDR cellsWritten 
INVOKE ExitProcess,0 ; 程序 结束 
main ENDP 
END main 


图 11-3 是 程序 输出 的 快照 ， 其 中 1 到 20 号 显示 为 图 形 字符 。 虽 然 印 刷 页 面 为 灰 度 显 
示 , 但 每 个 字符 都 是 不 同 的 颜色 . 








图 11-3 ”WriteColors 程序 的 输出 


11.1.12 ”时 间 与 日 期 函数 
Win32 API 有 相当 多 的 时 间 和 日 期 也 数 可 供 选 择 。 最 常见 的 是 ， 用 户 想 要 用 这 些 函 数 来 
获得 和 设置 当前 日 期 与 时 间 。 这 里 只 能 讨论 这 些 函 数 的 一 小 部 分 ， 不 过 在 Platform SDK 文 
档 中 可 以 查阅 到 表 11-9 列 出 的 Win32 函数 - 
表 11-9 Win32 DateTime 函数 








函数 说 明 
CompareFileTime 比较 两 个 64 位 的 文件 时 间 
DosDateTimeToFileTime 把 MS-DOS 日 期 和 时 间 值 转换 为 一 个 64 位 的 文件 时 间 
FileTimeToDosDateTime 把 64 位 文件 时 间 转 换 为 MS-DOS 日 期 和 时 间 值 
FileTimeToLocalFileTime 把 UTC (通用 协调 时 间 ) 文件 时 间 转 换 为 本 地 文件 时 间 
FileTimeToSystemTime 把 64 位 文件 时 间 转 换 为 系统 时 间 格 式 
GetFileTime 检索 文件 创建 、 最 后 访问 和 最 后 修改 的 日 期 与 时 间 
GetLocalTime 检索 当前 本 地 日 期 和 时 间 
GetSystemTime 以 UTC 格式 检索 当前 系统 日 期 和 时 间 





GetSystemTimeAdjustment 决定 系统 是 否 对 其 日 历 钟 进行 周期 性 时 间 调 整 
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函数 
GetSystemTimeAsFileTime 
GetTickCount 
GetTimeZoneInformation 
LocalFileTimeToFileTime 
SetFileTime 
SetLocalTime 
SetSystemTime 
SetSystemTimeAdjustment 
SetTimeZoneInformation 
SystemTimeToFileTime 
SystemTimeToTzSpecifcLocalTime 
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( 续 ) 
说 明 
以 UTC 格式 检索 当前 系统 日 期 和 时 间 
检索 自 系统 启动 后 经 过 的 毫秒 数 


检索 当前 时 区 参数 

把 本 地 文件 时 间 转 换 为 基于 UTC 的 文件 时 间 
设置 文件 创建 、 最 后 访问 和 最 后 修改 的 日 期 与 时 间 
设置 当前 本 地 时 间 与 日 期 

设置 当前 系统 时 间 与 日 期 

启用 或 禁用 对 系统 日 历 钟 进行 周期 性 时 间 调 整 
设置 当前 时 区 参数 

把 系统 时 间 转 换 为 文件 时 间 

把 UTC 时 间 转 换 为 指定 时 区 对 应 的 本 地 时 间 


SYSTEMTIME 结构 SYSTEMTIME 结构 由 Windows API 的 日 期 和 时 间 函 数 使 用 : 


SYSTEMTIME STRUCT 
WwWYear WORD ? 
wMonth WORD ? 
wDayOfWeek WORD ? 
wDay WORD ? 
wHour WORD ? 
wMinute WORD ? 
wSecond WORD ? 
wMilliseconds WORD ? 
SYSTEMTIME ENDS 


7 年 (4 个 数字 ) 
六 省 全 人 的 

; 星期 (0 一 6) 
CTS 

; 小 时 (0 一 23) 
7 分 钟 (0 一 59) 
7 秒 (0 一 59) 

; 毫秒 (0 一 999) 


字段 wDayOfWeek 的 值 依 序 为 星期 天 =0， 星 期 一 =1， 以 此 类 推 。wMilliseconds 中 的 
值 不 确定 ， 因 为 系统 可 以 与 时 钟 源 同步 周期 性 地 刷新 时 间 。 


1. GetLocalTime 和 SetLocalTime 


函数 GetLocalTime 根据 系统 时 钟 返回 日 期 和 当前 时 间 。 时 间 要 调整 为 本 地 时 区 。 调 用 
该 函数 时 ， 需 向 其 传递 一 个 指针 指向 SYSTEMTIME 结构 : 


GetLocalTime PROTO, 


lpSystemTime:PTR SYSTEMTIME 


函数 GetLocalTime 调用 示例 如 下 : 


data 
sysTime SYSTEMTIME <> 
.code 


INVOKE GetLocalTime, ADDR sysTime 


函数 SetLocalTime 设置 系统 的 本 地 日 期 和 时 间 。 调 用 时 ， 需 向 其 传递 一 个 指针 指向 包 
含 了 期 望 日 期 和 时 间 的 SYSTEMTIME 结构 : 


SetLocalTime PROTO, 


lpSystemTime:PTR SYSTEMTIME 


如 果 函 数 执行 成 功 ， 则 返回 非 零 整数 ;如 果 失 败 ， 则 返回 零 。 


2. GetTickCount 函数 


函数 GetTickCount 返回 从 系统 启动 起 经 过 的 毫秒 数 : 


GetTickCount PROTO ; EAX 为 返回 值 
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由 于 返回 值 为 一 个 双 字 ， 因 此 当 系 统 连续 运行 49.7 天 后 ， 时 间 将 会 回 绕 归 零 。 可 以 使 
用 这 个 函数 监视 循环 经 过 的 时 间 ， 并 在 达到 时 间 限 制 时 终止 循环 。 

下 面 的 程序 Timer.asm 计算 两 次 调用 GetTickCount 之 间 的 时 间 间 隔 。 程 序 尝试 确定 计 
时 器 没有 回 绕 (超过 49.7 天 )。 相 似 的 代码 可 以 用 于 各 种 程序 : 


; 计算 经 过 的 时 间 (Timer .asm) 
; 用 Win32 函数 GetTickCount 演示 一 个 简单 的 秒表 计时 器 。 
INCLUDE Irvine32.inc 

INCLUDE macros.inc 


.data 

startTime DWORD ? 

.code 

main PROC 
INVOKE GetTickCount ; 获得 开始 时 间 计 数 
mov startTime,eax 7 保存 开始 时 间 计 数 


; Create a useless calculation loop. 
mov ecx,10000100h 
L1: imul ebx 


imul ebx 
imul ebx 
loop Ll 
INVOKE GetTickCount ? 获得 新 的 时 间 计 数 
cmp eax,startTime ; 比 开始 时 间 计 数 小 ? 
jb error ; 时 间 回 绕 
sub eax,startTime ; 计算 间 隅 时 间 
call WriteDec ; 显示 间隔 时 间 
mWrite <” milliseconds have elapsed",0dh,0ah> 
jmp quit 

error: 


mWwrite "Error: GetTickCount invalid--system has" 
mWrite <"been active for more than 49.7 days",0dh,0ah> 
quit: 
exit 
main ENDP 
END main 
3. Sleep 函数 
有 些 时 候 程序 需要 暂停 或 延迟 一 小 段 时 间 。 虽 然 可 以 通过 构造 一 个 计算 循环 或 忙 循 环 来 
保持 处 理 器 工作 ， 但 是 不 同 的 处 理 器 会 使 得 执行 时 间 不 同 。 另 外 ， 忙 循环 还 不 必要 地 占用 了 
处 理 器 ， 这 会 降低 在 同一 时 间 执 行程 序 的 速度 。Win32 函数 Sleep 按照 指定 毫秒 数 暂停 当前 
执行 的 线程 : 
Sleep PROTO, 
dwMilliseconds:DWORD 
(由 于 本 书 汇编 语言 程序 是 单线 程 的 ， 因 此 假设 一 个 线程 就 等 同 于 一 个 程序 。) 当 线程 休 
眠 时 ， 它 不 会 消耗 处 理 器 时 间 。 
4. GetDateTime 过 程 
Irvine32 链接 库 中 的 过 程 GetDateTime 以 100 纳 秒 为 间隔 ， 返 回 从 1601 年 1 月 1 日 起 
经 过 的 时 间 间 隔 数 。 这 看 起 来 有 点 奇怪 ， 因 为 那个 时 候 计 算 机 还 是 未 知 的 。 对 任何 事件 ， 
Microsoft 都 用 这 个 值 来 跟踪 文件 日 期 和 时 间 。 如 果 想 要 为 日 期 计算 准备 系统 日 期 /时 间 值 ， 
Win32 SDK 建议 采用 如 下 步骤 : 
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1 ) 调用 函数 ， 如 GetLocalTime， 填 充 SYSTEMTIME 结构 。 

2 ) 调用 函数 SystemTimeToFileTime， 将 SYSTEMTIME 结构 转换 为 FILETIME 结构 。 
3 ) 将 得 到 的 FILETIME 结构 复制 到 64 位 的 四 字 。 

FILETIME 结构 把 64 位 四 字 分 割 为 两 个 双 字 : 


FILETIME STRUCT 
loDateTime DWORD ? 
hiDateTime DWORD ? 

FILETIME ENDS 


下 面 的 GetDateTime 过 程 接收 一 个 指针 ， 指 向 64 位 四 字 变 量 。 它 用 Win32 FILETIME 
格式 将 当前 日 期 和 时 间 保 存 到 变量 中 : 


GetDateTime PROC, 
PStartTime:PTR QWORD 
LOCAL sysTime:SYSTEMTIME, flTime:FILETIME 


; 以 64 位 整数 形式 ( 按 Win32 FILETIME 格式 ) 获得 并 保存 当前 本 
; 地 日 期 / 时 间 。 


; 获得 系统 本 地 时 间 
INVOKE GetLocalTime, 
ADDR sysTime 
;SYSTEMTIME 转换 为 FILETIME 
INVOKE SystemTimeToFileTime, 
ADDR sysTime, 
ADDR flTime 


; 把 FILETIME 复制 到 一 个 64 位 整数 
mov esi,pStartTime 
mov eax,flTime.loDateTime 
mov DWORD PTR [esil],eax 
mov eax,flTime.hiDateTime 
mov DWORD PTR [esi+4],eax 
ret 

GetDateTime ENDP 


由 于 FILE 是 一 个 64 位 整数 ， 因 此 可 以 使 用 7.4 节 的 扩展 精度 算法 来 实现 日 期 的 计算 。 
11.1.13 ”使 用 64 位 Windows API 


任何 对 Windows API 的 32 位 调用 都 可 以 重新 编写 为 64 位 调用 。 只 需要 记 住 几 个 关键 
点 就 可 以 : 

1 ) 输入 与 输出 句柄 是 64 位 的 。 

2 ) 调用 系统 函数 前 ， 主 调 程序 必须 保留 至 少 32 字 节 的 影子 空间 ， 其 方法 是 将 堆栈 指针 
(RSP) 寄存 器 减 去 32。 这 使 得 系统 函数 能 利用 这 个 空间 保存 RCX、RDX、R8 和 R9 寄存 器 
的 临时 副本 。 

3 ) 调用 系统 函数 时 ，RSP 需 对 齐 16 字 节 地 址 边界 (基本 上 ， 任 何 十 六 进 制 地 址 的 最 低 
位 数字 都 是 0)。 幸 运 的 是 ，Win64 API 似乎 没有 强制 执行 这 条 规则 ， 而 且 在 应 用 程序 中 对 
堆栈 对 齐 进 行 精确 控制 往往 是 比较 困难 的 。 

4 ) 系统 调用 返回 后 ， 主 调 方 必须 回复 RSP 的 初始 值 ， 方 法 是 加 上 在 函数 调用 前 减 去 的 
数值 。 如 果 是 在 子 程序 中 调用 Win64 API， 那 么 这 一 点 非常 重要 ， 因 为 在 执行 RET 指令 时 ， 
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ESP 最 终 须 指向 子 程序 的 返回 地 址 。 

5 ) 整数 参数 利用 64 位 寄存 器 传递 。 

6 ) 不 允许 使 用 INVOKE。 取 而 代 之 ， 前 4 个 参数 要 按照 从 左 到 右 的 顺序 ， 依 次 放 人 这 
4 个 寄存 器 : RCX、RDX、R8 和 R9。 其 他 参数 则 压 人 运行 时 堆栈 。 

7 ) 系统 函数 用 RAX 存放 返回 的 64 位 整数 值 。 

下 面 的 代码 行 演示 了 如 何 从 Irvine64 链接 库 中 调用 64 位 GetStdHandle 函数 : 


-data 

STD OUTPUT HANDLE EQU -11 
consoleOutHandle QWORD ? 
-Code 


sub rsp,40 ; 预 留 影子 空间 & 对 齐 RSP 

mov rcx,STD OUTPUT HANDLE 

call GetSstdHandle 

mov consoleOutHandle,rax 

add rsp,a0 

一 旦 控制 台 输出 句柄 被 初始 化 ， 可 以 用 后 面 的 代码 来 演示 如 何 调用 64 位 WriteConsoleA 
函数 。 这 里 有 5 个 参数 : RCX (控制 台 句 柄 )、RDX (字符 串 指 针 )、R8 (字符 串 长 度 ) 
R9 (byteWritten 变量 指针 )， 以 及 最 后 一 个 虚拟 零 参数 ， 它 位 于 RSP 上面 的 第 5 个 堆栈 
位 置 。 


WriteString proc uses rcx rdx r8 r9 


sub rsp, (5 * 8) ; 为 5 个 参数 预 留 空 间 
movr cx,rdx 

call Str length ; 用 EAX 返回 字符 串 长 度 
mov rcx,consoleOutHandle 

mov rdx,rdx ; 字符 串 指针 

mov r8, rax ; 字符 串 长 度 


lea r9,bytesWritten 
mov qword ptr [rsp + 4 * SIZEOF QWORD],0 ; 总 是 0 
call WriteConsoleaA 
add rsp,(5 * 8) ;恢复 RSP 
ret 
WriteString ENDP 


11.1.14 ”本 节 回顾 


1. 怎样 的 链接 命令 能 为 Win32 控制 台 指定 目标 程序 ? 

2.( 真 / 假 ): 以 W 结 尾 的 函数 (如 WriteConsoleW) 被 设计 为 与 宽 (16 位 ) 字符 (如 
Unicode) 一 起 使 用 。 

3.( 真 / 假 ): Unicode 为 Windows98 的 原生 字符 集 。 

4.( 真 / 假 ): 函数 ReadConsole 从 输入 缓冲 区 读 取 鼠标 信息 。 

5.( 真 / 假 ); Win32 控制 台 输 入 函数 能 检测 到 用 户 调整 了 控制 台 窗 口 大 小 。 


11.2 编写 图 形 化 的 Windows 应 用 程序 


本 节 将 展示 如 何 为 32 位 Microsoft Windows 编写 简单 的 图 形 化 应 用 程序 。 该 程序 创建 
并 显示 一 个 主 窗口 ， 显 示 消 息 框 ， 并 响应 鼠标 事件 。 本 节 内 容 为 简介 性 质 ， 即 使 是 最 简单 
的 Windows 应 用 程序 也 需要 整个 一 章 的 篇 幅 来 描述 其 工作 。 如 果 和 希望 了 解 更 多 信息 ， 请 参 
阅 Platform SDK 文档 ， 以 及 另 一 个 重要 文献 查尔斯 * 佩 措 尔 德 (Charles Petzold) 撰写 的 
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《 Programming Windows 》。 


表 11-10 列 出 了 编写 该 程序 时 需要 的 各 种 链接 库 和 头 文件 。 利 用 本 书 Examples\Ch11\ 
WinApp 文件 夹 中 的 Visual Studio 项 目 文件 来 建立 和 运行 该 程序 。 


表 11-10 ”建立 WinApp 程序 时 需要 的 文件 


文件 名 说 明 
WinApp.asm 程序 源 代码 
GraphWin.asm 头 文件 ， 包 含 程序 要 使 用 的 结构 、 常 量 和 函数 原型 
kemel32.lib 本 章 前 面 使 用 的 MS-Windows API 链接 库 
user32.lib 其 他 MS-Windows API 函数 


/SUBSYSTEM : WINDOWS 代替 了 之 前 章节 中 使 用 的 /SUBSYSTEM : CONSOLE。 程 
序 从 kernel32.lib 和 user32.lib 这 两 个 标准 MS-Windows 链接 库 中 调用 函数 。 
主 窗口 ”本 程序 显示 一 个 全 屏 主 窗口 。 为 了 让 窗口 适合 本 书页 面 ， 这 里 缩小 了 它 的 尺寸 
(图 11-4 )。 


11.2.1 必要 的 结构 


结构 POINT 以 像素 为 单位 ， 定 义 屏幕 上 一 个 点 的 X 坐标 和 Y 坐标 。 它 可 以 用 于 定位 图 
形 对 象 、 窗 口 和 鼠标 点 击 : 
POINT STRUCT 
ptX DWORD ? 


ptY DWORD ? 
POINT ENDS 





et 2 
3 A en Ue; 


图 11-4 WinApp 程序 的 主 开始 窗口 


结构 RECT 定义 矩形 边界 。 成 员 left 为 矩形 左边 的 X 坐标 ， 成 员 top 为 矩形 上 边 的 Y 
坐标 。 成 员 right 和 bottom 保存 矩形 类 似 的 值 : 


RECT STRUCT 


left DWORD ? 

top DWORD ? 

right DWORD ? 

bottom DWORD ? 
RECT ENDS 


结构 MSGStruct 定义 MS-Windows 需要 的 数据 : 
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MSGStruct STRUCT 
msgwnd DWORD ? 
msgMessage DWORD ? 
msgWparam DWORD ? 
msgLparam DWORD ? 
msgTime DWORD ? 
msgPt POINT <> 

MSGStruct ENDS 


结构 WNDCLASS 定义 窗口 类 。 程 序 中 的 每 个 窗口 都 必须 属于 一 个 类 ， 并且 每 个 程序 都 
必须 为 其 主 窗口 定义 一 个 窗口 类 。 在 主 窗口 可 以 显示 之 前 ， 这 个 类 必须 要 注册 到 操作 系统 : 


WNDCLASS STRUC 


style DWORD ? ; 窗口 样式 选项 
lpfnwndProc DWORD ? ; WinProc 函数 指针 
cbClsExtra DWORD ? ; 共享 内 存 
cbWwndExtra DWORD ? ; 附加 字 节 数 
hIinstance DWORD ? ; 当前 程序 句柄 
hIcon DWORD ? ; 图 标 句柄 
hCursor DWORD ? ; 光标 句柄 
hbrBackground DWORD ? ; 背景 刷 句柄 
lpszMenuName DWORD ? 7 菜单 名 指针 
lpszClassName DWORD ? ;WinClass 名 指针 
WNDCLASS ENDS 
下 面 对 上 述 参数 进行 简单 小 结 : 
e style 是 不 同样 式 选项 的 集合 ， 比 如 WS_CAPTION 和 WS_BORDER， 用 于 控制 窗口 
外 观 和 行为 。 
e lpfnWndProc 是 指向 (本 程序 中 ) 函数 的 指针 ， 该 函数 接收 并 处 理由 用 户 触发 的 事件 
消息 。 
e@ cbClsExtra 指向 一 个 类 中 所 有 窗口 使 用 的 共享 内 存 。 可 以 为 空 。 
e cbWndExtra 指定 分 配给 后 面 窗口 实例 的 附加 字 节 数 。 
e hInstance 为 当前 程序 实例 的 句柄 。 
e hIcon 和 hCursor 分 别 为 当前 程序 中 图 标 资源 和 光标 资源 的 句柄 。 
e hbrBackground 为 背景 (颜色) 刷 的 句柄 。 
e lpszMenuName 指向 一 个 菜单 名 。 
e lpszClassName 指向 一 个 空 字 节 结 束 的 字符 串 ， 该 字符 串 中 包含 了 窗口 的 类 名 称 。 


11.2.2 MessageBox 函数 


对 程序 而 言 ， 显 示 文 本 最 简单 的 方法 是 将 文本 放 和 弹出 消息 框 中 ， 并 等 待 用 户 点 击 按 
钮 。Win32 API 链接 库 的 MessageBox 函数 能 显示 一 个 简单 的 消息 框 。 其 函数 原型 如 下 : 


MessageBox PROTO, 
hwnd:DWORD, 
lpText:PTR BYTE, 
lpCaption:PTR BYTE, 
uType:DWORD 


hWnd 是 当前 窗口 的 句柄 。lpText 指向 一 个 空 字 节 结束 的 字符 串 ， 该 字符 串 将 在 消息 杠 
中 显示 。lpCaption 指向 一 个 空 字 节 结束 的 字符 串 ， 该 字符 串 将 在 消息 框 的 标题 栏 中 显示 。 
style 是 一 个 整数 ， 用 于 描述 对 话 框 的 图 标 (可 选 ) 和 按钮 ( 必 选 )。 按 钮 由 常数 标识 ， 如 
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MB_OK 和 MB_YESNO。 图 标 也 由 常数 标识 ， 如 MB_ICONQUESTION。 显 示 消 息 框 时 ， 
可 以 同时 添加 图 标 常数 和 按钮 常数 : 


INVOKE MessageBox, hWnd, ADDR QuestionText, 
ADDR QuestionTitle, MB OK + MB _ ICONQUESTION 


11.2.3 WinMain 过 程 


每 个 Windows 应 用 程序 都 需要 一 个 启动 过 程 ， 通 常 将 其 命名 为 WinMain， 该 过 程 负责 
下 述 任务 : 

e 得 到 当前 程序 的 句柄 。 

e 加 载 程序 的 图 标 和 光标 。 

e 注册 程序 的 主 窗口 类 ， 并 标识 处 理 该 窗口 事件 消息 的 过 程 。 

e 创建 主 窗口 。 

e 显示 并 更 新 主 窗口 。 

e 开始 接收 和 发 送 消息 的 循环 ， 直 到 用 户 关闭 应 用 程序 窗口 。 

WinMain 包含 一 个 名 为 GetMessage 的 消息 处 理 循环 ， 从 程序 的 消息 队列 中 取出 下 一 条 可 
用 消息 。 如 果 GetMessage 取出 的 消息 是 WM_QUIT， 则 返回 零 ， 即 通知 WinMain 暂停 程序 。 
对 于 其 他 消息 ，WinMain 将 它们 传递 给 DispatchMessage 函数 ， 该 函数 再 将 消息 传递 给 程序 的 
WinProc 过 程 。 若 想 进 一 步 了 解 消息 ， 请 查阅 Platform SDK 文档 的 Windows Messages。 


11.2.4 WinProc 过 程 


WinProc 过 程 接收 并 处 理 所 有 与 窗口 有 关 的 事件 消息 。 这 些 事件 绝 大 多 数 是 由 用 户 通过 
点 击 和 拖 动 鼠标 、 按 下 键盘 按键 等 操作 发 起 的 。 这 个 过 程 的 工作 就 是 解码 每 个 消息 ， 如 果 消 
息 得 以 识别 ， 则 在 应 用 程序 中 执行 与 该 消息 相关 的 任务 。 过 程 声明 如 下 : 


WinProc PROC, 


hwnd:DWORD， ; 窗口 句柄 
localMsg:DWORD, ; 消息 ID 
wParam:DWORD, ; 参数 1 (可 变 ) 
lParam: DWORD 7 参数 2 (可 变 ) 


根据 具体 的 消息 ID， 第 三 个 和 第 四 个 参数 的 内 容 可 变 。 比 如 ， 若 点 击 鼠 标 ， 那 么 
lParam 就 为 点 击 位 置 的 X 坐标 和 YY 坐标 。 在 后 面 的 示例 程序 中 ，WinProc 过 程 处 理 了 三 种 
特定 的 消息 : 

e。WM_LBUTTONDOWN ,用户 按 下 鼠标 左 键 时 产生 该 消息 

e WM_CREATE ， 表 示 刚 刚 创 建 主 窗口 

e。 WM_CLOSE， 表 示 将 要 关闭 应 用 程序 主 窗口 

比如 ， 下面 的 代码 行 (摘自 过 程 WinProc) 通过 调用 MessageBox 向 用 户 显示 一 个 弹出 
消息 框 来 处 理 WM_LBUTTONDOWN: 


.IF eax == WM LBUTTONDOWN 
INVOKE MessageBox, hwnd, ADDR PopupText, 
ADDR PopupTitle, MB _ OK 
jmp WinProcExit 


用 户 所 见 的 结果 消息 如 图 11-5 所 示 。 其 他 不 希望 被 处 理 的 消息 都 会 被 传递 给 DefWindow- 
Proc (MS-Windows 默认 的 消息 处 理 程序 )。 
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Popup Window 





图 11-5 ”WinApp 程序 的 弹出 窗口 


11.2.5 ”ErrorHandler 过 程 


过 程 ErrorHandler 是 可 选 的 ， 如 果 在 注册 和 创建 程序 主 窗口 的 过 程 中 系统 报错 ， 则 调用 
该 过 程 。 比 如 ， 如 果 成 功 注册 程序 主 窗口 ， 则 函数 RegisterClass 返回 非 零 值 。 但 是 ， 如 果 
该 函数 返回 值 为 零 ， 那 么 就 调用 ErrorHandler (显示 一 条 消息 ) 并 退出 程序 : 
INVOKE RegisterClass, ADDR MainWin 
.IF eax == 0 
call ErrorHandler 
jmp Exit Program 
.ENDIF 
过 程 ErrorHandler 需要 执行 几 个 重要 任务 : 
e@ 调用 GetLastError 取得 系统 错误 号 。 
e 调用 FormatMessage 取得 合适 的 系统 格式 化 的 错误 消息 字符 串 。 
e 调用 MessageBox 显示 包含 错误 消息 字符 串 的 弹出 消息 框 。 


e 调用 LocalFree 释放 错误 消息 字符 串 使 用 的 内 存 空间 。 


11.2.6 ”程序 清单 

不 要 担心 这 个 程序 的 长 度 ， 其 中 大 部 分 的 代码 在 任何 MS-Windows 应 用 程序 中 都 是 一 
样 的 : 

;Windows 应 用 程序 (WinApp.asm) 


; 本 程序 显示 一 个 可 调 大 小 的 应 用 程序 窗口 和 几 个 弹出 消息 框 。 特 别 感 谢 Tom Joyce 
; 提供 了 本 程序 的 第 一 个 版 本 。 
.386 


.model flat,SsTDCALL 
INCLUDE GraphWin.inc 


AppLoadMsgTitle BYTE "Application Loaded",0 
AppLoadMsgText BYTE "This window displays when the WM CREATE " 
BYTE "message is received",0 


PopupTitle BYTE "Popup Window",0 
PopupText BYTE "This window was activated by a " 
BYTE "WM LBUTTONDOWN message",0 


GreetTitle BYTE "Main Window Active",0 
GreetText BYTE "This window is shown immediately after " 
BYTE "CreateWindow and UpdateWindow are called.",0 


CloseMsg BYTE "WM CLOSE message received",0 


RIFOFTIEle BYTE "ErrFOr";O 

WindowName BYTE "ASM Windows App",0 
488 className BYTE "ASMWin",0 

; 定义 应 用 程序 的 窗口 类 结构 。 
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MainWin WNDCLASS <NULL,WinProc,NULL,NULL,NULL,NULL,NULL, 
COLOR_ WINDOW,NULL,className> 


msg MSGStruct <> 
winRect RECT <> 
hMainwnd DWORD ? 
hIinstance DWORD ? 





‘Code 
WinMain PROC 


;获得 当前 过 程 的 句柄 。 


INVOKE GetModuleHandle, NULL 
mov hIinstance, eax 
mov Mainwin.hIinstance, eax 


; 加 载 程序 的 图 标 和 光标 。 
INVOKE LoadIcon, NULL, IDI APPLICATION 
mov MainWin.hIcon, eax 
INVOKE LoadCursor, NULL, IDC ARROW 
mov MainWin.hCursor, eax 
? 注册 窗 口 类 。 
INVOKE RegisterClass, ADDR MainWin 
IF eax == 
call ErrorHandler 
jmp Exit Program 
.ENDIF 


; 创建 应 用 程序 的 主 窗口 。 

INVOKE CreateWindowEx, 0, ADDR className, 
ADDR WindowName,MAIN WINDOW STYLE, 
CW_USEDEFAULT,CW_ USEDEFAULT,CW USEDEFAULT, 
CW_USEDEFAULT, NULL, NULL, hIinstance,NULL 


; 若 CreatWindowEx 失败 ， 则 显示 消息 并 退出 。 
IF eax == 
call ErrorHandler 
jmp Exit Program 
"ENDIF 
; 保存 窗口 和 句柄， 显示 并 绘制 窗口 。 
mov hMainWwnd,eax 
INVOKE ShowWindow, hMainwnd, SW_SHOW 
INVOKE UpdateWindow, hMainWwnd 


? 显示 欢迎 消息 。 
INVOKE MessageBox, hMainWnd, ADDR GreetText, 
ADDR GreetTitle, MB_OK 


; 启动 程序 的 连续 消息 处 理 循环 。 
Message_Loop; 
; 从 队列 中 取出 下 一 条 消息 。 
INVOKE GetMessage, ADDR msg, NULDL,NULDL,NULL 
; 车 没 有 其 他 消息 则 退出 。 
IF eax == 0 
jmp Exit Program 
» ENDIF 
; 将 消息 传递 给 程序 的 WinProc。 
INVOKE DispatchMessage, ADDR msg 
jmp Message Loop 
Exit_ Program: 
INVOKE ExitProcess,0 
WinMain ENDP 
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在 前 面 的 循环 中 ，msg 结构 被 传递 给 函数 GetMessage。 该 函数 对 结构 进行 填充 ， 然 
后 再 把 它 传递 给 MS-Windows 函数 DispatchMessage。 





WinProc PROC, 
hwnd:DWORD, localMsg:DWORD, wParam:DWORD, lParam:DWORD 


; 应 用 程序 的 消息 处 理 过 程 ， 处 理应 用 程序 特定 的 消息 。 其 他 所 有 消息 则 传递 给 
; 默认 的 Windows 消息 处 理 过 程 。 


mov eax, localMsg 


.IF eax == WM LBUTTONDOWN ; 鼠标 按钮 ? 
INVOKE MessageBox, hWnd, ADDR PopupText, 
ADDR PopupTitle, MB OK 
jmp WinProcExit 
,ELSEIF eax == WM_ CREATE ; 创建 窗口 ? 
INVOKE MessageBox, hWnd, ADDR AppLoadMsgText, 
ADDR AppLoadMsgTitle, MB OK 
jmp WinProcExit 
.ELSEIF eax == WM CLOSE ; 关闭 窗口 ? 
INVOKE MessageBox, hWnd, ADDR CloseMsg, 
ADDR WindowName, MB_OK 
INVOKE PostQuitMessage0 
jmp WinProcExit 
-ELSE ; 其 他 消息 ? 
INVOKE DefWindowProc, hWnd, localMsg, wParam, 
jmp WinProcExit 
"ENDIF 


lParam 


WinProcExit: 
ret 
WinProc ENDP 


ErrorHandler PROC 
; 显示 合适 的 系统 错误 消息 。 


data 
pErrorMsg DWORD ? ; 错误 消息 指针 
messageID DWORD ? 
.Code 
INVOKE GetLastError ; 用 EAX 返回 消息 ID 
mov messagelID,eax 


; 获取 相应 的 消息 字符 串 。 


INVOKE FormatMessage, FORMAT MESSAGE ALLOCATE BUFFER + \ 
FORMAT MESSAGE FROM SYSTEM,NULL,messageID,NULL, 
ADDR pErrorMsg,NULL,NULL 


; 显示 错误 消息 。 
INVOKE MessageBox,NULL, pErrorMsg, ADDR ErrorTitle, 
MB _ ICONERROR+MB OK 


; 释放 错误 消息 字符 串 。 
INVOKE LocalFree, pErrorMsg 
ret 

ErrorHandler ENDP 

END WinMain 


运行 程序 
第 一 次 加 载 程 序 时 ， 显 示 如 下 消息 框 : 
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当 用 户 关闭 Main Window Active 消息 框 时 ， 就 会 显示 程序 的 主 窗口 : 





A A Ee | 


当 用 户 关 闭 该 消息 框 ， 并 点 击 主 窗口 右上 角 上 的 X 时 ,那么 在 窗口 关闭 之 前 将 显示 如 
下 消息 框 : 





当 用 户 关闭 了 这 个 消息 框 后 ， 则 程序 结束 。 


11.2.7 ”本 节 回 顾 


1. 请 说 明 POINT 结构 。 

2. 如 何 使 用 WNDCLASS 结构 ? 

3. 在 WNDCLASS 结构 中 ，1lpfnWndProc 字段 的 含义 是 什么 ? 
4. 在 WNDCLASS 结构 中 ，style 字段 的 含义 是 什么 ? 

5. 在 WNDCLASS 结构 中 ，hInstance 字段 的 含义 是 什么 ? 


11.3 ”动态 内 存 分 配 
动态 内 存 分 配 ( dynamic memory allocation)， 又 被 称 为 堆 分 配 ( heap allocation)， 是 编 
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程 语言 使 用 的 一 种 技术 ， 用 于 在 创建 对 象 、 数 组 和 其 他 结构 时 预 留 内 存 。 比 如 在 Java 语言 
中 ,下 面 的 语句 就 会 为 String 对 象 保留 内 存 : 


String str = new String("abcde"); 


同样 的 ， 在 C++ 中 ， 对 变量 使 用 大 小 属性 就 可 以 为 一 个 整数 数组 分 配 空间 : 

int size; 

cin >> size; // 用 户 输入 大 小 

int array[] = new int[size]; 

C、C++ 和 Java 都 有 内 置 运行 时 堆 管 理 器 来 处 理 程序 请 求 的 存储 分 配 和 释放 。 程 序 启 动 
时 ， 堆 管理 器 常常 从 操作 系统 中 分 配 一 大 块 内 存 ， 并 为 存储 块 指针 创建 空闲 列表 (free list)。 
当 接收 到 一 个 分 配 请 求 时 ， 堆 管理 器 就 把 适当 大 小 的 内 存 块 标识 为 已 预 留 ， 并 返回 指向 该 块 
的 指针 。 之 后 ， 当 接收 到 对 同一 个 块 的 删除 请 求 时 ， 堆 就 释放 该 内 存 块 ， 并 将 其 返回 到 空闲 
列表 。 每 次 接收 到 新 的 分 配 请 求 ， 堆 管理 器 就 会 扫描 空闲 列表 ， 寻 找 第 一 个 可 用 的 、 且 容量 
足够 大 的 内 存 块 来 响应 请 求 。 

汇编 语言 程序 有 两 种 方法 进行 动态 分 配 。 方 法 一 ， 通 过 系统 调用 从 操作 系统 获得 内 存 
块 。 方 法 二 ， 实 现 自己 的 堆 管 理 器 来 服务 更 小 的 对 象 提出 的 请 求 。 本 节 展 示 的 是 如 何 实现 第 
一 种 方法 。 示 例 程序 为 32 位 保护 模式 的 应 用 程序 。 

利用 表 11-11 中 的 几 个 Win32 API 函数 就 可 以 从 Windows 中 请 求 多 个 不 同 大 小 的 内 存 
块 。 表 中 所 有 的 函数 都 会 覆盖 通用 寄存 器 ， 因 此 程序 可 能 想 要 创建 封装 过 程 来 实现 重要 寄存 
器 的 入 栈 和 出 栈 操作 。 若 需 进 一 步 了 解 存 储 管理 ， 请 在 Microsoft 在 线 文档 中 查阅 Memory 


Management Reference。 


表 11-11 堆 相 关 函 数 
函数 描述 


1 | 用 EAX 返回 程序 现存 堆 区 域 的 32 位 整数 句柄 。 如 果 函 数 成 功 ， 则 EAX 中 的 返回 值 为 堆 句柄 。 
GetProcessHeap | 如 果 函 数 失 败 ， 则 EAX 中 的 返回 值 为 NULL 


和 从 堆 中 分 配 内 存 块 。 如 果 成 功 ，EAX 中 的 返回 值 就 为 内 存 块 的 地 址 。 如 果 失 败 ， 则 EAX 中 的 返 
回 值 为 NULL 


创建 新 堆 ， 并 使 其 对 调用 程序 可 用 。 如 果 函 数 成 功 ， 则 EAX 中 的 返回 值 为 新 创建 堆 的 句柄 。 如 
果 失 败 ， 则 EAX 的 返回 值 为 NULL 


HeapDestroy 销毁 指定 堆 对 象 , 并 使 其 句柄 无 效 。 如 果 函 数 成 功 ， 则 EAX 中 的 返回 值 为 非 零 


释放 之 前 从 堆 中 分 配 的 内 存 块 ， 该 堆 由 其 地 址 和 堆 句柄 进行 标识 。 如 果 内 存 块 释放 成 功 ， 则 返回 
值 为 非 零 


对 堆 中 内 存 块 进行 再 分 配 和 调整 大 小 。 如 果 函 数 成 功 ， 则 返回 值 为 指向 再 分 配 内 存 块 的 指针 。 如 
果 函 数 失败 ， 且 设 有 指定 HEAP_GENERATE_ EXCEPTIONS， 则 返回 值 为 NULL 


返回 之 前 通过 调用 HeapAlloc 或 HeapReAlloc 分 配 的 内 存 块 的 大 小 。 如 果 函 数 成 功 ， 则 EAX 包 
HeapSize 会 被 分 配 内 存 块 的 字 节 数 。 如 果 函 数 失 败 ， 则 返回 值 为 SIZE_T-1 ( SIZE_T 等 于 指针 能 指向 的 最 大 
字 节 数 ) 


GetProcessHeap 如果 使 用 的 是 当前 程序 的 默认 堆 ， 那 么 GetProcessHeap 就 足够 了 。 
这 个 函数 没有 参数 ，EAX 中 的 返回 值 就 是 堆 句柄 : 


GetProcessHeap PROTO 


示例 调用 : 


HeapCreate 


HeapFree 


HeapReAlloc 
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.data 

hHeap HANDLE ? 

.Code 

INVOKE GetProcessHeap 

“IF eax == NULL ; 不 能 获取 句柄 
jmp quit 

"ELSE 
mov hHeap,eax ; 句柄 OK 

» ENDIF 


HeapCreate HeapCreate 能 为 当前 程序 创建 一 个 新 的 私有 堆 : 


HeapCreate PROTO, 


flOptions :DWORD, ; 堆 分 配 选 项 
dwInitialsize:DWORD, ; 按 字 节 初始 化 扒 大 小 
dwMaximumSize:DWORD ; 最 大 堆 字 节 数 


flOptions 设置 为 NULL。dwlInitialSize 设置 为 初始 堆 字 节 数 ， 其 值 的 上 限 为 下 一 页 的 边 
界 。 如 果 HeapAlloc 的 调用 超过 了 初始 堆 大 小 ， 那 么 堆 最 大 可 以 扩展 到 dwMaximumSize 参 
数 中 指定 的 大 小 (上限 为 下 一 页 的 边界 )。 调 用 后 ，EAX 中 的 返回 值 为 空 就 表示 堆 未 创建 成 
功 。HeapCreate 的 调用 示例 如 下 : 


HEAP START = 2000000 ? 2 MB 
HEAP MAX = 400000000 ; 400 MB 
"data 
hHeap HANDLE ? ; 推 句 柄 
-Code 
INVOKE HeapCreate, 0, HEAP START, HEAP MAX 
.IF eax == NULL ; 推 未 创建 
call WritewindowsMsg ; 显示 错误 消息 
jmp quit 
.了 ELSE 
mov hHeap,eax ; 句柄 OK 
» ENDIF 


HeapDestroy HeapDeatroy 销毁 一 个 已 存在 的 私有 堆 (由 HeapCreate 创建 )。 需 向 其 
传递 堆 句柄 : 


HeapDestroy PROTO, 
hHeap: DWORD ; 推 句柄 


如 果 堆 销毁 失败 ， 则 EAX 等 于 NULL。 下 面 为 示例 调用 ， 其 中 使 用 了 11.1.4 节 描 述 的 
WriteWindowsMsg 过 程 : 


.data 
hHeap HANDLE ? ; 推 句 柄 
.Code 
INVOKE HeapDestroy, hHeap 
.IF eax == NULL 

call WriteWindowsMSg 7 显示 错误 消息 
.ENDIF 


HeapAlloc HeapAlloc 从 已 存在 堆 中 分 配 一 个 内 存 块 : 


HeapAlloc PROTO, 


hHeap:HANDLE, ; 现 有 堆 内 存 块 的 句柄 
dwFlags :DWORD, ; 堆 分 配 控制 标志 
dwBytes : DWORD ; 分 配 的 字 节 数 


EE 
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需 传 递 下 述 参 数 : 

e hHeap，32 位 堆 句 柄 ， 该 堆 由 GetProcessHeap 或 HeapCreate 初始 化 。 

e dwFlags， 一 个 双 字 ， 包 含 了 一 个 或 多 个 标志 值 。 可 以 选择 将 其 设置 为 HEAP_ 
ZERO_MEMORY ， 即 设置 内 存 块 为 全 零 。 

e dwBytes, 一 个 双 字 ， 表示 堆 分 配 的 字 节 数 。 

如 果 HeapAlloc 成 功 ， 则 EAX 包含 指向 新 存储 区 的 指针 ; 如 果 失 败 ， 则 EAX 中 的 返回 


值 为 NULL。 下 面 的 代码 用 hHeap 标识 一 个 堆 ， 从 该 堆 中 分 配 了 一 个 1000 字 节 的 数组 ， 并 
将 数组 初始 化 为 全 零 : 


“data 

hHeap HANDLE ? ; 推 名 柄 
pArray DWORD ? ; 数组 指针 
Code 


INVOKE HeapAlloc, hHeap, HEAP 2ZERO MEMORY, 1000 
,IE eax == NULL 
mWwrite "HeapAlloc failed" 
jmp quit 
.ELSE 
mov pArray,eax 
» ENDIF 


HeapFree ”函数 HeapFree 释放 之 前 从 堆 中 分 配 的 一 个 内 存 块 ， 该 堆 由 其 地 址 和 堆 句 柄 
标识 : 
HeapFree PROTO, 
hHeap:HANDLE, 
dwFlags :DWORD, 
lpMem: DWORD 


第 一 个 参数 是 包含 该 内 存 块 的 堆 的 句柄 。 第 二 个 参数 通常 为 零 ， 第 三 个 参数 是 指向 将 被 
释放 内 存 块 的 指针 。 如 果 内 存 块 释放 成 功 ， 则 返回 值 非 零 。 如 果 该 块 不 能 被 释放 ， 则 函数 返 
回 零 。 示 例 调用 如 下 : 


INVOKE HeapFree, hHeap, 0, pArray 


Error Handling 若 在 调用 HeapCreate 、HeapDestroy 或 GetProcessHeap 时 遇 到 错误 ， 
可 以 通过 调用 API 函数 GetLastError 来 获得 详细 信息 。 还 可 以 调用 Irvine32 链接 库 的 函数 
WriteWindowsMsg。HeapCreate 调用 示例 如 下 : 

INVOKE HeapCreate, 0,HEAP START, HEAP MAX 


IF eax == NULL ; 失败? 

call WriteWindowsMsg ; 显示 错误 信息 
.ELSE 

mov  hHeap,eax ; 成 功 
ENDIF 


反之 ， 函 数 HeapAlloc 在 失败 时 不 会 设置 系统 错误 码 ， 因 此 也 就 无 法 调用 GetLastError 
或 WriteWindowsMsg。 


11.3.1 HeapTest 程序 


下 面 的 程序 示例 ( Heaptestl.asm) 使 用 动态 内 存 分 配 创建 并 填充 了 一 个 1000 字 节 的 
数组 : 
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; 推测 试 #1 (Heaptest1l.asm) 
INCLUDE Irvine32.inc 

; 使 用 动态 内 存 分 配 ， 本 程序 分 配 并 填充 一 个 字 节 数组 。 

.data 

ARRAY SIZE = 1000 

FILL VAL EQU 0FFh 


hHeap HANDLE ? ; 程序 堆 句 柄 
PArray DWORD ? ; 内 存 块 指针 
newHeap DWORD ? ; 新 推 句柄 
strl BYTE "Heap size is: ",0 


.Code 

main PROC 
INVOKE GetProcessHeap 
IF eax == NULL 
call WriteWindowsMsg 
jmp quit 
.ELSE 
mov  hHeap,eax ;成功 
ENDIF 


; 获取 程序 堆 句柄 
; 如 果 失 败 ， 显 示 消 息 


call allocate array 
jnc arrayOk ; 失败 (CF=1) ? 
call WriteWwindowsMsg 
Call ‘Crif 
jmp quit 
arrayOk: ; 成 功 填充 数组 
call fill array 
call display array 
Cub CE 
; 释放 数组 
INVOKE HeapFree, hHeap, 0, pArray 
quit: 
exit 
main ENDP 


allocate array PROC USES eax 


E 动态 分 配 数 组 空间 。 
; 接收 : EAX= 程序 堆 句 柄 
; 返回 : 如 果 内 存 分 配 成 功 ， 则 CF=0。 


INVOKE HeapAlloc, hHeap, HEAP ZERO MEMORY, ARRAY SIZE 496 
.IF eax == NULL 
stc ; 返回 CF=1 
.ELSE 
mov pArray,eax ; 保存 指针 
cle ; 返回 CF=0 
ENDIF 
ret 
allocate array ENDP 


fill array PROC USES ecx edx esi 


; 用 一 个 字符 填充 整个 数组 。 
; 接收 : 无 
; 返回 : 无 
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mov ecx,ARRAY SIZE 
mov esi,pArray 


Ll: mov 
inc esi 
loop Ll 
ret 


fill array ENDP 


mov eCcx,ARRAY SIZE 
mov esi,pArray 


Ll: mov al,[esi] 
mov ebx, TYPE BYTE 
call WriteHexB 
inc esi 
loop Ll1 


ret 
display_array ENDP 


END main 
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; 循环 计数 器 
; 指向 数组 


BYTE PTR [esi],FILL VAL ; 填充 每 个 字 节 


; 下 一 个 位 置 


7 循环 计数 器 
; 指向 数组 
; 取出 一 个 字 节 


; 显示 该 字 节 
; 下 一 个 位 置 


下 面 的 示例 (Heaptest2.asm) 采用 动态 内 存 分 配 重复 分 配 大 块 内 存 ， 直 到 超过 堆 大 小 。 


; 堆 测试 #2 

INCLUDE Irvine32.inc 
data 

HEAP START = 2000000 
HEAP MAX = 400000000 
BLOCK_ SIZE = 500000 


hHeap HANDLE ? 
pData DWORD ? 


(Heaptest2 .asm) 


72MB 
7400MB 
70.5MB 


; 扒 句柄 
; 块 指针 


strl BYTE 0dh,0ah,"Memory allocation failed",0dh,0ah,0 


.Code 
main PROC 


INVOKE HeapCreate, 0,HEAP START, HEAP MAX 


,IF eax == NULL 

call WriteWwindowsMsg 
oall ‘Crif 

jmp quit 

.ELSE 

mov hHeap,eax 

. ENDIF 

mov ecx,2000 


Ll: call allocate block 
IF Carry? 
mov edx,OFFSET strl 
call Writestring 


jmp quit 
ELSE 
mov RL 


; 失败 ? 


;成功 


; 循环 计数 器 
; 分 配 一 个 块 
; 失败? 

; 显示 消息 


; 否 : 打印 一 个 点 来 显示 进度 
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call WriteChar 
-ENDIF 


;call free block ; 允许 / 禁止 本 行 
loop Ll 


quit: 
INVOKE HeapDestroy，hHeap ; 销毁 堆 
.IF eax == NULL ;失败 ? 
call WritewindowsMsg ; 是 : 错误 消息 
Gall ‘CELE 
» ENDIF 
exit 
main ENDP 


allocate block PROC USES ecx 


;分配 一 个 块 ， 并 填充 为 全 零 。 
INVOKE HeapAlloc, hHeap, HEAP ZERO MEMORY, BLOCK SIZE 


‘IF eax == NULL 


stc ; 返回 CF=1 
.ELSE 

mov PpData,eax ; 保存 指针 

cle ; 返回 CF=0 
ENDIF 
ret 


allocate block ENDP 


free block PROC USES ecx 


INVOKE HeapFree, hHeap, 0, pData 
ret 

free block ENDP 

END main 


11.3.2 ”本 节 回顾 


1. 在 C、C++ 和 Java 上 下 文中 ， 堆 分 配 的 另 一 个 术语 是 什么 ? 
2. 请 说 明 GetProcessHeap 函数 。 

3. 请 说 明 HeapAlloc 函数 。 

4. 给 出 HeapCreate 函数 的 一 个 示例 调用 。 

5. 调用 HeapDestroy 时 ， 如 何 标识 将 被 销毁 的 内 存 块 ? 


11.4 x86 存储 管理 


本 节 将 对 Windows 32 位 存储 管理 进行 简要 说 明 ， 展 示 它 是 如 何 使 用 x86 处 理 器 直接 内 
置 功能 的 。 重 点 关注 的 是 存储 管理 的 两 个 主要 方面 : 

e 将 逻辑 地 址 转换 为 线性 地 址 

e 将 线性 地 址 转换 为 物理 地 址 (分 页 ) 

下 面 先 简单 回顾 一 下 第 2 章 介 绍 过 的 一 些 x86 存储 管理 术语 : 

@ 多 任务 处 理 ( multitasking) 允许 多 个 程序 (或 任务 ) 同时 和 运行。 处理 器 在 所 有 运行 程 
序 中 划分 其 时 间 。 

e 段 (segments) 是 可 变 大 小 的 内 存 区 ， 用 于 让 程序 存放 代码 或 数据 。 

e 分 段 (segmentation) 提供 了 分 隔 内 存 段 的 方法 。 它 允许 多 个 程序 同时 运行 又 不 会 相 
互 干 扰 。 
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@ 段 描述 符 ( segment descriptor) 是 一 个 64 位 的 值 ， 用 于 标识 和 描述 一 个 内 存 段 。 它 
包含 的 信息 有 段 基 址 、 访 问 权 限 、 段 限 长 、 类 型 和 用 法 。 

现在 再 增加 两 个 新 术语 : 

@ 段 选择 符 ( segment selector) 是 保存 在 段 寄存 器 (CS、DS、SS、ES、FS 或 GS) 中 
的 一 个 16 位 数值 。 

e@ 逻辑 地 址 (logical address) 就 是 段 选择 符 加 上 一 个 32 位 的 偏 移 量 。 

本 书 一 直 都 忽略 了 段 寄 存 器 ， 因 为 用 户 程 序 从 来 不 会 直接 修改 这 些 寄存 器 ， 所 以 只 关注 


了 32 位 数据 偏 移 量 。 但 是 ， 从 系统 程序 员 的 角度 来 看 ， 段 寄存 器 是 很 重要 的 ， 因 为 它们 包 


含 了 对 内 存 段 的 直接 引用 。 


11.4.1 线性 地 址 


1. 逻辑 地 址 转换 为 线性 地 址 

多 任务 操作 系统 允许 几 个 程序 (任务 ) 同时 在 内 存 中 运行 。 每 个 程序 都 有 自己 唯一 的 数 
据 区 。 假 设 现 有 3 个 程序 ， 每 个 程序 都 有 一 个 变量 的 偏 移 地 址 为 200h， 那 么 ， 怎 样 区 分 这 3 
个 变量 而 不 进行 共享 ? x86 解决 这 个 问题 的 方法 是 ， 用 一 步 或 两 步 处 理 过 程 将 每 个 变量 的 偏 
移 量 转 换 为 唯一 的 内 存 地 址 。 

第 一 步 ， 将 段 值 加 上 变量 偏 移 量 形成 线性 地 址 (linear address)。 这 个 线性 地 址 可 能 就 是 
该 变量 的 物理 地 址 。 但 是 像 MS-Windows 和 Linux 这 样 的 操作 系统 采用 了 分 页 (paging) 功 
能 ， 它 使 得 程序 能 使 用 比 可 用 物理 空间 更 大 的 线性 空间 。 这 种 情况 下 ， 就 必需 采用 第 二 步 页 
转换 (page translation)， 将 线性 地 址 转换 为 物理 地 址 。 页 转换 将 在 11.4.2 节 介 绍 。 

首先 了 解 一 下 处 理 器 如 何 用 段 和 选择 符 来 确 
定 变量 的 线性 地 址 。 每 个 段 选 择 符 都 指向 一 个 段 
描述 符 (位 于 描述 符 表 中 )， 其 中 包含 了 该 内 存 段 
的 基地 址 。 如 图 11-6 所 示 ， 逻 辑 地 址 中 的 32 位 
偏 移 量 加 上 段 基 址 就 形成 了 32 位 的 线性 地 址 。 

线性 地 址 ”线性 地 址 是 一 个 32 位 整数 ， 其 范 
围 为 OFFFFFFFFh， 它 表示 一 个 内 存 位 置 。 如 果 禁 
止 分 页 功能 ， 那 么 线性 地 址 也 就 是 目标 数据 的 物 ”SDTRLDTR 


| 
理 地 址 。 (包含 描述 符 


2. 分 页 表 的 基 址 ) 

分 页 是 x86 处 理 器 的 一 个 重要 功能 ， 它 使 得 图 11-6 逻辑 地 址 转换 为 线性 地 址 
计算 机 能 运行 在 其 他 情况 下 无 法 装 入 内 存 的 一 组 
程序 。 处 理 器 初始 只 将 部 分 程序 加 载 到 内 存 ， 而 程序 的 其 他 部 分 仍然 留 在 硬盘 上 。 程 序 使 
用 的 内 存 被 分 割 成 若干 小 区 域 ， 称 为 页 ( page)， 通 常 一 页 大 小 为 4KB。 当 每 个 程序 运行 时 ， 
处 理 器 会 选择 内 存 中 不 活跃 的 页 面 替换 出 去 ， 而 将 立即 会 被 请 求 的 页 加 载 到 内 存 。 

操作 系统 通过 维护 一 个 页 目录 (page directory) 和 一 组 页 表 (page table) 来 持续 跟踪 当前 
内 存 中 所 有 程序 使 用 的 页 面 。 当 程序 试图 访问 线性 地 址 空间 内 的 一 个 地 址 时 ， 处 理 器 会 自动 
将 线性 地 址 转换 为 物理 地 址 。 这 个 过 程 被 称 为 页 转换 ( page translation)。 如 果 被 请 求 页 当前 
不 在 内 存 中 ， 则 处 理 器 中 断 程序 并 产生 一 个 页 故障 ( page fault)。 操 作 系 统 将 被 请 求 页 从 硬盘 
复制 到 内 存 ， 然 后 程序 继续 执行 。 从 应 用 程序 的 角度 看 ， 页 故障 和 页 转换 都 是 自动 发 生 的 。 
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使 用 Microsoft Windows 工具 任务 管理 器 (task manager) 就 可 以 查看 物理 内 存 和 虚拟 内 
存 的 区 别 。 图 11-7 所 示 计 算 机 的 物理 内 存 为 256MB。 任务 管理 器 的 Commit Charge 框 内 为 ”[500 
当前 可 用 的 虚拟 内 存 总 量 。 虚 拟 内 存 的 限制 为 633MB， 大 大 高 于 计算 机 的 物理 内 存 。 





两 石 吓 | 





图 11-7 Windows 任务 管理 器 示例 


3. 描述 符 表 

段 描述 符 可 以 在 两 种 表 内 找到 : 全 局 描述 符 表 (global description table) 和 局 部 描述 符 
表 (local description table ) 。 

全 局 描述 符 表 ( GDT) 开机 过 程 中 ， 当 操作 系统 将 处 理 器 切换 到 保护 模式 时 ， 会 创建 
唯一 一 张 GDT， 其 基 址 保存 在 GDTR (全 局 描述 符 表 寄 存 器 ) 中 。 表 中 的 表 项 〈 称 为 段 描 述 
符 ) 指向 段 。 操 作 系统 可 以 选择 将 所 有 程序 使 用 的 段 保存 在 GDT 中 。 

局 部 描述 符 表 ( LDT) 在 多 任务 操作 系统 中 ， 每 个 任务 或 程序 通常 都 分 配 有 自己 的 段 
描述 符 表 ， 称 为 LDT。LDTR 寄存 器 保存 的 是 程序 LDT 的 地 址 。 每 个 段 描述 符 都 包含 了 段 
在 线性 地 址 空间 内 的 基地 址 。 一 般 ， 段 与 段 之 间 是 相互 区 分 的 。 如 图 11-8 所 示 ， 图 中 有 三 
个 不 同 的 逻辑 地 址 ， 这 些 地 址 选择 了 LDT 中 三 个 不 同 的 表 项 。 这 里 ， 假 设 禁止 分 页 ， 因 此 ， 
线性 地 址 空间 也 是 物理 地 址 空间 。 

4. 段 描述 符 详细 信息 

除了 段 基 址 ， 段 描述 符 还 包含 了 位 映射 字段 来 说 明 段 限 长 和 段 类 型 。 只 读 类 型 段 的 一 个 
例子 就 是 代码 段 。 如 果 程 序 试图 修改 只 读 段 ， 则 会 产生 处 理 器 故障 。 502 

段 描述 符 可 以 包含 保护 等 级 ， 以 便 保 护 操作 系统 数据 不 被 应 用 程序 访问 。 下 面 是 对 每 个 
描述 符 字 段 的 说 明 : 
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泌 辑 地 址 线性 地 址 空间 
fe 局 部 描述 符 表 
EC 

DS 偏 移 量 (索引 ) 
L0010 [000001B6 用 一 >18| 001A0000 | 








10 


CS EP 08 
00 


图 11-8 索引 局 部 描述 符 表 


基 址 : 一 个 32 位 整数 ， 定 义 段 在 4GB 线性 地 址 空间 中 的 起 始 地 址 。 

特权 级 : 每 个 段 都 可 以 分 配 一 个 特权 级 ， 特 权 级 范围 从 0 到 3， 其 中 0 级 为 最 高 级 ， 一 
般 用 于 操作 系统 核心 代码 。 如 果 特 权 级 数值 高 的 程序 试图 访问 特权 级 数值 低 的 段 ， 则 发 生 处 
理 器 故障 。 

段 类 型 : 说 明 段 的 类 型 并 指定 段 的 访问 类 型 以 及 段 生 长 的 方向 (向 上 或 向 下 )。 数 据 ( 包 
括 堆 栈 ) 段 可 以 是 可 读 类 型 或 读 / 写 类 型 其 生长 方向 可 以 是 向 上 的 也 可 以 是 向 下 的 。 代 码 
段 可 以 是 只 执行 类 型 或 执行 / 只 读 类 型 。 

段 存在 标志 : 这 一 位 说 明 该 段 当 前 是 否 在 物理 内 存 中 。 

粒度 标志 : 确定 对 段 限 长 字段 的 解释 。 如 果 该 位 清 零 ， 则 段 限 长 以 字 节 为 单位 。 如 果 该 
位 置 1， 则 段 限 长 的 解释 单位 为 4096 字 节 。 

段 限 长 : 这 个 20 位 的 整数 指定 段 大 小 。 按 照 粒度 标志 ， 这 个 字段 有 两 种 解释 : 

e 该 段 有 多 少 字 节 ， 范 围 为 1 一 1MB。 

e 该 段 包含 多 少 个 4096 字 节 ， 人 允许 段 大 小 的 范围 为 4KB ~ 4GB。 


11.4.2 ”页 转换 


若 允 许 分 页 ， 则 处 理 器 必须 将 32 位 线性 地 址 转换 为 32 位 物理 地 址 *。 这 个 过 程 会 用 到 
3 种 结构 : 

e 页 目录 : 一 个 数组 ， 最 多 可 包含 1024 个 32 位 页 目录 项 。 

e 页 表 : 一 个 数组 ， 最 多 可 包含 1024 个 32 位 页 表 项 。 

e 页 : 4KB 或 4MB 的 地 址 空间 。 

为 了 简化 下 面 的 叙述 ,假设 页 面 大 小 为 4KB: 

线性 地 址 分 为 三 个 字段 : 页 目录 表 项 指针 、 页 表 项 指针 和 页 内 偏 移 量 。 控 制 寄存 器 
(CR3 ) 保存 了 页 目录 的 起 始 地 址 。 如 图 11-9 所 示 ， 处 理 器 在 进行 线性 地 址 到 物理 地 址 的 转 
换 时 ， 采 用 如 下 步骤 : 

1 ) 线性 地 址 引用 线性 地 址 空间 中 的 一 个 位 置 。 

2 ) 线性 地 址 中 10 位 的 目录 字段 是 页 目录 项 的 索引 。 页 目录 项 包含 了 页 表 的 基 址 。 

3 ) 线性 地 址 中 10 位 的 页 表 字 段 是 页 表 的 索引 ， 该 页 表 由 页 目录 项 指定 。 索 引 到 的 页 表 
项 包含 了 物理 内 存 中 页 面 的 基 址 。 


0002A000 
00003000 
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4 ) 线性 地 址 中 12 位 的 偏 移 量 字 段 与 页 面 基 址 相 加 ， 生 成 的 恰好 是 操作 数 的 物理 地 址 。 


线性 地 址 
10 10 12 


日 录 | 下 到 | 人 从 是 有 





11-9 线性 地 址 转换 为 物理 地 址 


操作 系统 可 以 选择 让 所 有 的 运行 程序 和 任务 使 用 一 个 页 目录 ， 或 者 选择 让 每 个 任务 使 用 
一 个 页 目录 ， 还 可 以 选择 为 两 者 的 组 合 。 

Windows 虚拟 机 管理 器 

现在 对 IA-32 如 何 管理 内 存 已 经 有 了 总 体 了 解 ， 那 么 看 看 Windows 如 何 处 理 内 存 管 理 
可 能 也 会 令 人 感 兴趣 。 下 面 这 段 文字 转自 Microsoft 在 线 文 档 : 


虚拟 机 管理 器 (VMM) 是 Windows 内 核 中 的 32 位 保护 模式 操作 系统 。 它 创建 、 
运行 、 监 视 和 终止 虚拟 机 。 它 管理 内 存 、 进 程 、 中 断 和 异常 。 它 与 虚拟 设备 ( virtual 
device) 一 起 工作 ， 使 得 它们 能 拦截 中 断 和 故障 ， 以 此 来 控制 对 硬件 和 已 安装 软件 的 访 
问 。VMM 和 虚拟 设备 运行 在 特权 级 为 0 的 单一 32 位 平坦 模式 地 址 空间 中 。 系 统 创 建 两 
个 全 局 描述 符 表 项 ( 段 描述 符 )， 一 个 是 代码 段 的 ， 一 个 是 数据 段 的 。 段 固定 在 线性 地 址 
0。VMM 提供 多 线程 和 抢先 多 任务 处 理 。 通 过 共享 运行 应 用 程序 的 虚拟 机 之 间 的 CPU 
时 间 ， 它 可 以 同时 运行 多 个 应 用 程序 。 












在 上 面 的 文字 中 ， 可 以 将 虚拟 机 解释 为 Intel 中 的 过 程 或 任务 。 它 包含 了 程序 代码 、 支 
撑 软 件 、 内 存 和 寄存 器 。 每 个 虚拟 机 都 被 分 配 了 自己 的 地 址 空间 、LO 端口 空间 、 中 断 向 量 
表 和 局 部 描述 符 表 。 运 行 于 虚拟 8086 模式 的 应 用 程序 特权 级 为 3。Windows 中 保护 模式 程 
序 的 特权 级 为 0 和 3。 


11.4.3 ”本 节 回 顾 
1. 术语 解释 : 
a. 多 任务 b. 分 段 
2. 术语 解释 : 
a. 段 选择 符 b. 逻辑 地 址 


3.( 真 / 假 ): 段 选择 符 指 向 段 描述 符 表 的 一 个 表 项 。 
4.( 真 / 假 ): 段 描述 符 包含 了 段 的 基地 址 。 
5.( 真 / 假 ): 段 选择 符 是 32 位 的 。 

6.( 真 / 假 ): 段 描述 符 不 包含 段 大 小 信息 。 
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11.5 ”本 章 小 结 


表面 上 看 ，32 位 控制 台 模 式 程序 的 外 观 和 行为 就 像 运 行 在 文本 模式 下 的 16 位 MS-DOS 
程序 。 这 两 种 类 型 的 程序 都 从 标准 输入 读 ， 向 标准 输出 写 ， 支 持 命令 行 重 定 向 ， 还 可 以 显示 
彩色 文本 。 但 是 ,深入 了 解 会 发 现 ，Win32 控制 台 与 MS-DOS 程序 是 有 很 大 不 同 的 。Win32 
运行 于 32 位 保护 模式 ， 而 MS-DOS 运行 于 实地 址 模式 。Win32 程序 可 以 调用 图 形 Windows 
应 用 程序 使 用 的 函数 库 内 的 函数 。 而 MS-DOS 程序 只 局 限于 BIOS 的 一 个 小 子 集 ， 以 及 从 出 
现 IBM-PC 后 就 存在 的 MS-DOS 中 断 。 

Windows API 函数 使 用 的 字符 集 类 型 : 8 位 的 ASCILANSI 字符 集 和 16 位 的 Unicode 字 
符 集 。 

API 函数 使 用 的 标准 MS-Windows 数据 类 型 必须 转换 为 MASM 数据 类 型 (参见 表 11-1 )。 

控制 台 句 柄 为 32 位 整数 ， 用 于 控制 台 窗口 的 输入 /输出 。 函 数 GetStdHandle 获取 控 
制 台 句柄 。 进 行 高 级 控制 台 输 入 ,调用 函数 ReadConsole ; 进行 高 级 控制 台 输 出 ， 调 用 
WriteConsole。 创 建 和 打开 文件 时 ， 调 用 CreateFile。 读 文件 时 ， 调 用 ReadFile ; 写 文件 时 ， 
调用 WriteFile。CloseHandle 关闭 一 个 文件 。 移 动 文件 指针 ， 调 用 SetFilePointer。 

要 操作 控制 台 屏幕 缓冲 区 ,调用 SetConsoleScreenBufferSize。 要 改变 文本 颜色 ， 调 用 
SetConsoleTextAttribute。 本 章 的 程序 WriteColors 演示 了 函数 WriteConsoleOutputAttribute 
和 WriteConsoleOutputCharacter。 

要 获取 系统 时 间 ， 调 用 GetLocalTime ; 要 设置 时 间 ， 调 用 SetLocalTime。 这 两 个 函数 
都 要 使 用 SYSTEMTIME 结构 。 本 章 的 GetDateTime 函数 示例 用 64 位 整数 返回 日 期 和 时 间 ， 
指明 从 1601 年 1 月 1 日 开始 经 过 了 多 少 个 100 纳 秒 。 函 数 TimerStart 和 TimerStop 可 用 来 
创建 一 个 简单 的 秒表 计时 器 。 

创建 图 形 MS-Windows 应 用 程序 时 ， 用 该 程序 的 主 窗口 类 信息 填充 WNDCLASS 结构 。 
创建 WinMain 过 程 获取 当前 过 程 的 句柄 、 加 载 图 标 和 光标 、 注 册 程 序 的 主 窗 口 、 创 建 主 窗 
口 、 显 示 和 更 新 主 窗口 ， 并 开始 接收 和 发 送 消息 的 循环 。 

WinProc 过 程 负责 处 理 输入 的 Windows 消息 ,一 般 由 用 户 行为 激活 ， 比 如 点 击 鼠 标 或 
者 按键 。 本 章 的 示例 程序 处 理 了 WM_LBUTTONDOWN、WM_CREATE 和 WM_CLOSE 消 
息 。 当 检测 到 相应 事件 时 ， 就 会 显示 弹出 消息 。 

动态 内 存 分 配 ， 或 堆 分 配 是 保留 和 释放 用 户 程序 所 用 内 存 的 工具 。 汇 编 语言 程序 有 两 种 
方法 来 实现 动态 内 存 分 配 。 第 一 种 ， 进 行 系统 调用 ， 从 操作 系统 获得 内 存 块 。 第 二 种 ， 实 现 
自己 的 堆 管 理 器 来 响应 小 型 对 象 的 请 求 。 下 面 是 动态 内 存 分 配 最 重要 的 Win32 API 调用 : 

e GetProcessHeap 返回 程序 已 存在 内 存 堆 区 域 的 32 位 整数 句柄 。 

HeapAlloc 从 堆 中 分 配 一 个 内 存 块 。 

HeapCreate 新 建 一 个 堆 。 

HeapDestroy 销毁 一 个 堆 。 

HeapFree 释放 之 前 从 堆 分 配 出 去 的 内 存 块 。 

HeapReAlloc 从 堆 中 重新 分 配 内 存 块 ， 并 重新 定义 块 大 小 。 
HeapSize 返回 之 前 分 配 的 内 存 块 的 大 小 。 

本 章 的 内 存 管理 小 节 主 要 涉及 两 个 问题 : 将 逻辑 地 址 转换 为 线性 地 址 ， 以 及 将 线性 地 址 
转换 为 物理 地 址 。 

逻辑 地 址 中 的 选择 符 指向 段 描述 符 表 的 表 项 ， 这 个 表 项 又 指向 线性 空间 内 的 一 个 段 。 
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段 描述 符 包 含 了 段 信息 ， 如 段 大 小 和 访问 类 型 。 描 述 符 表 有 两 种 : 唯一 的 全 局 描述 符 表 
(GDT)， 以 及 一 个 或 多 个 局 部 描述 符 表 (LDT)。 
分 页 是 x86 处 理 器 的 一 个 重要 功能 ， 它 使 得 计算 机 能 运行 在 其 他 情况 下 无 法 装 入 内 存 的 
一 组 程序 。 处 理 器 初始 只 将 部 分 程序 加 载 到 内 存 ， 同 时 ， 程 序 的 其 他 部 分 仍然 留 在 硬盘 上 。 
处 理 器 利用 页 目录 、 页 表 和 页 面 生成 数据 的 物理 地 址 。 页 目录 包含 了 页 表 指 针 。 页 表 包 含 了 
页 面 指 针 。 
阅读 若 想 进 一 步 阅读 了 解 Windows 编程 ， 下 面 的 书籍 可 能 会 有 所 帮助 : 
e Mark Russinovich 和 David Solomon ,《 Windows Internals 》， 第 1、2 部 分 ，Microsoft 
Pressy 2012。 
® Barry Kauler,《 Windows Assembly Language and System Programming 》，CMP 
Books，1997。 


e Charles Petzold,《 Programming Windows 》， 第 5 版 ，Microsoft Press，1998。 
11.6 关键 术语 
Application Programming Interface(API) (应 用 程 page directory (页 目录 ) 


序 接口 ) 
base address ( 基 址 ) 


page fault (页 故障 ) 
page table (页 表 ) 


commit charge frame (认可 用 量 框 ) 

console handle (控制 台 句 柄 ) 

comsole input buffer (控制 台 输 入 缓冲 区 ) 
descriptor table (描述 符 表 ) 

dynamic memory allocation (动态 内 存 分配 ) 
Global Descriptor Table(GDT) (全 局 描述 符 表 ) 
granularity (粒度 ) 

heap allocation( 堆 分 配 ) 

linear address (线性 地 址 ) 

Local Descriptor Table(LDT) (局 部 描述 符 表 ) 
logical address (逻辑 地 址 ) 

multitasking (多 任务 ) 


11.7 复习 题 和 练习 


page translation ( 页 转换 ) 
paging (分 页 ) 

physical address (物理 地 址 ) 
phyvilege level (特权 级 ) 
screen buffer (屏幕 缓冲 区 ) 
segment ( 段 ) 

segment selector ( 段 选择 符 ) 
segmentation (分 段 ) 
segment descriptor ( 段 描述 符 ) 
task manager (任务 管理 器 ) 
Unicode 

Win32 Platform SDK 


c. HANDLE 


11.7.1 简 答题 

1. 写 出 与 下 面 标准 MS-Windows 类 型 匹配 的 MASM 数据 类 型 
a. BOOL b. COLORREF 
d. LRPSTR e. WPARAM 


2. 哪个 Win32 函数 返回 标准 输入 的 句柄 ? 


3. 哪个 Win32 函数 从 键盘 读 取 一 个 字符 串 ， 并 将 其 放 人 缓冲 区 ? 


4. 请 描述 COORD 结构 。 


5. 哪个 Win32 函数 能 以 文件 开始 为 基 址 .将 文件 指针 移动 到 指定 偏 移 量 的 位 置 ? 


6. 哪个 Win32 函数 能 修改 控制 台 窗 口 标题 ? 


7. 哪个 Win32 函数 能 修改 屏幕 缓冲 区 的 外 形 尺 寸 ? 


404 过 11 草 


8. 哪个 Win32 函数 能 修改 光标 大 小 ? 

9. 哪个 Win32 函数 能 修改 后 续 输 出 文本 的 颜色 ? 

10. 哪个 Win32 函数 能 将 一 组 属性 值 复制 到 控制 台 屏幕 缓冲 区 的 连续 单元 格 ? 
11. 哪个 Win32 函数 能 按 指定 毫秒 数 暂 停 程 序 ? 

12. 调用 CreateWindowEx 时 ， 如 何 将 窗口 外 观 信息 传递 给 该 函数 ? 
13. 请 说 出 两 个 在 调用 MessageBox 函数 时 会 用 到 的 按钮 常量 。 

14. 请 说 出 两 个 在 调用 MessageBox 函数 时 会 用 到 的 图 标 常量 。 

15. 请 说 出 至 少 3 个 由 WinMain (启动 ) 过 程 执行 的 任务 。 

16. 请 说 明 WinProc 过 程 在 示例 程序 中 的 作用 。 

17. 示例 程序 中 的 WinProc 过 程 处 理 哪些 消息 ? 

18. 请 说 明 ErrorHandler 过 程 在 示例 程序 中 的 作用 。 

19, CreateWindow 调用 后 立刻 激活 的 消息 框 出 现在 应 用 程序 主 窗口 之 前 还 是 之 后 ? 
20. 由 WM_CLOSE 激活 的 消息 框 出 现在 关闭 主 窗口 之 前 还 是 之 后 ? 
21. 请 对 线性 地 址 进行 说 明 。 

22. 线性 内 存 与 分 页 之 间 存 在 怎样 的 关系 ? 

23. 如 果 禁 用 分 页 ， 处 理 器 如 何 将 线性 地 址 转换 为 物理 地 址 ? 

24. 分 页 有 哪些 好 处 ? 

25. 哪个 寄存 器 包含 了 局 部 描述 符 表 的 基地 址 ? 

26. 哪个 寄存 器 包含 了 全 局 描述 符 表 的 基地 址 ? 

27. 允许 存在 多 少 全 局 描述 符 表 ? 

28. 允许 存在 多 少 局 部 描述 符 表 ? 

29. 请 说 出 至 少 4 个 段 描述 符 内 的 字段 。 

30. 分 页 处 理 涉 及 哪些 结构 ? 

31. 哪 种 结构 包含 了 页 表 的 基地 址 ? 

32. 哪 种 结构 包含 了 页 面 的 基地 址 ? 


11.7.2 算法 基础 


1. 编写 代码 段 调用 函数 ReadConsol。 

2. 编写 代码 段 调用 函数 WriteConsole。 

3. 编写 代码 段 调 用 函数 CreateFile 打开 已 有 文档 以 便 读 出 。 

4. 编写 代码 段 调用 函数 CreateFile 用 标准 属性 新 建 一 个 文档 ， 并 删除 其 他 已 存在 的 同名 文件 。 
5. 编写 代码 段 调用 函数 ReadFile。 

6. 编写 代码 段 调用 函数 WriteFile。 

7. 编写 代码 段 调用 函数 MessageBox。 


11.8 ”编程 练习 


*1.ReadString 
使 用 堆栈 参数 ， 实 现 自己 的 ReadString 过 程 。 向 其 传递 一 个 字符 串 指针 ， 以 及 一 个 指明 最 大 
输入 字符 数 的 整数 。( 用 EAX) 返回 实际 输入 的 字符 数 。 本 过 程 必须 从 控制 台 输入 字符 串 ， 并 在 字 
符 串 末尾 (0Dh 占据 的 位 置 ) 插入 一 个 空 字 节 。Win32 ReadConsole 函数 细节 请 参见 11.1.4 节 。 编 
写 简单 程序 对 本 过 程 进行 测试 。 
“xx2. 字 符 串 输入 / 输出 
编写 程序 ， 用 Win32 ReadConsole 函数 接收 用 户 输入 的 如 下 信息 : 名字、 姓氏、 年龄、 电话 号 
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码 。 使 用 Win32 WriteConsole 函数 ， 用 标签 和 好 看 的 格式 重新 显示 这 些 信 息 。 不 要 使 用 Irvine32 链 
接 库 的 任何 过 程 。 
ix* 3. 清除 屏幕 
链接 库 的 Clrscr 过 程 清除 屏幕 ， 请 编写 自己 版 本 的 Clrscr 过 程 。 
要 4. 随机 填充 屏幕 
编写 程序 ， 用 随机 颜色 和 随机 字符 填充 每 个 屏幕 单元 格 。 附 加 条 件 : 每 个 字符 的 颜色 有 50% 
的 概率 为 红色 。 
xx* 5. DrawBox 
利用 本 书 封底 内 页 字符 集 的 画 线 字符 在 屏幕 上 绘制 一 个 方 框 。 提 示 : 使 用 WriteConsoleOutput- 
Character 函数 。 
xx 6. 学 生 记录 
编写 程序 新 建 一 个 文本 文件 。 提 示 用 户 输入 : 学 生 ID、 姓 氏 、 名 字 和 出 生日 期 。 将 这 些 信 息 
写 人 文件 。 用 同样 的 方式 输入 若干 记录 ， 再 关闭 文件 。 
*r7. 文本 窗口 滚动 
编写 程序 ， 向 控制 台 屏 幕 缓冲 区 写 和 人 50 行文 本 ， 为 每 行 编号 。 把 控制 台 窗口 移动 到 缓冲 区 项 
部 ， 并 开始 以 稳定 速率 (每 秒 两 行 ) 向 上 滚动 文本 。 当 控制 台 窗口 到 达 缓 冲 区 底部 时 ， 停 止 滚动 。 
*## 8. 方块 动画 
编写 程序 ， 用 几 个 带 颜色 的 方块 (ASCII 码 为 DBh) 在 屏幕 上 绘制 一 个 小 正方 形 。 按 照 随机 生 
成 方向 ， 在 屏幕 上 移动 这 个 正方 形 。 延 迟 时 间 固 定 为 50 毫秒 。 另 外 : 在 10 毫秒 100 毫秒 之 间 ， 随 
机 生成 延迟 时 间 。 
xi* 9. 文件 的 最 后 访问 时 间 
编写 过 程 LastAccessDate， 用 文件 的 日 期 和 时 间 戳 信息 填充 SYSTEMTIME 结构 。 用 EDX 传 
递 文件 名 的 偏 移 量 ， 用 ESI 传递 SYSTEMTIME 结构 的 偏 移 量 。 若 函数 未 成 功 发 现 文件 ， 则 将 进 
位 标志 位 置 1。 在 实现 这 个 函数 时 ， 需 要 打开 一 个 文件 ， 获 取 其 句柄 ， 将 句柄 传递 给 GetFileTime， 
再 把 这 个 函数 的 输出 传递 给 FileTimeToSystemTime， 最 后 关闭 文件 。 编 写 测试 程序 ， 调 用 
LastAccessDate 并 输出 特定 文件 最 后 被 访问 的 时 间 。 输 出 示例 如 下 : 


chll 09.asm was last accessed on: 6/16/2005 


xx 10. 读 大 型 文件 
修改 11.1.8 节 的 ReadFile.asm 程序 ， 使 其 能 读 取 大 于 输入 缓冲 区 的 文件 。 将 缓冲 区 大 小 减少 
到 1024 字 节 。 使 用 循环 不 断 读 取 并 显示 文件 ， 直 到 再 无 数据 可 读 。 如 果 想 用 WriteString 来 显示 
缓冲 区 ， 则 需 在 缓冲 区 数据 末尾 插入 一 个 空 字 节 。 
广 女 妇 1 | 链表 
进 阶 练习 : 使 用 本 章 介绍 的 动态 内 存 分 配 函 数 实现 一 个 单 向 链表 。 每 个 链接 节点 都 是 一 个 
Node 结构 (参见 第 10 章 )， 其 中 包含 一 个 整数 值 和 一 个 指针 ， 指 向 链表 上 的 下 一 个 节点 。 使 用 
循环 ， 提 示 用 户 输入 尽 可 能 多 的 整数 。 对 每 个 输入 的 整数 ， 分 配 一 个 Node 对 象 ， 将 其 值 插入 
Node， 再 将 这 个 Node 添加 到 链表 。 当 输入 数值 为 0 时， 停止 循环 。 最 后 ， 按 照 从 头 到 尾 的 顺序 
显示 整个 链表 。 若 之 前 已 有 用 高 级 语句 创建 链表 的 经 验 ， 则 可 以 尝试 本 题 。 


本 章 尾 注 


1. 来 源 ; Microsoft MSDN 文档 ,http://msdn.microsoft.com/en-us/library/windows/desktop/ms682073(v=vs.85 )， 
aspx 


2. Pentium Pro 及 其 后 的 处 理 器 允许 36 位 地 址 ， 但 是 在 这 里 不 做 叙述 。 





An 


| 


S11 


第 12 章 | 


Assembly Language for x86 Processors, Seventh Edition 


浮 点 数 处 理 与 指令 编码 





12.1 浮 点 数 二 进 制 表示 


十 进 制 浮 点 数 有 三 个 组 成 部 分 : 符号 、 有 效 数字 和 阶 码 。 比 如 ， 在 -1.23154 x 105 
中 ， 符 号 为 负 ， 有 效 数字 为 1.23154， 阶 码 为 5。( 虽 然 有 点 不 太 正 确 ， 有 时 用 术语 尾数 
(mantissa) 来 代替 有 效 数 字 (significand)。) 


查找 Intel x86 文档 。 为 了 最 大 程度 理解 本 章 ， 请 阅读 《Intel 64 and IA-32 Architectures 
Software Developers Manual 》 卷 1 和 卷 2。 用 浏览 器 访问 www.intel.com， 查 阅 《IA-32 手 


册 》。 





12.1.1 IEEE 二 进 制 浮 点 数 表示 


x86 处 理 器 使 用 的 三 种 浮 点 数 二 进 制 存储 格式 都 是 由 IEEE 标准 754-1985 一 一 二 进 制 浮 
点 数 运算 ( Standard 754-1985 for Binary Floating-Point Arithmetic ) 一 一 所 指定 。 表 12-1 列 
出 了 它们 的 特点 '。 
表 12-1 IEEE 浮 点 数 二 进 制 格式 


32 位 : 1 位 符号 位 ，8 位 阶 码 ，23 位 为 有 效 数字 的 小 数 部 分 。 大 致 的 规格 化 范围 2“ ~ 22。 也 
被 称 为 短 实数 (short real) 


64 位 : 1 位 符号 位 ，11 位 阶 码 ，52 位 为 有 效 数字 的 小 数 部 分 。 大 致 的 规格 化 范围 : 2 2 ~ 2 2。 
也 被 称 为 长 实数 (long real) 


80 位 : 1 位 符号 位 ，15 位 阶 码 ，1 位 为 整数 部 分 ，63 位 为 有 效 数字 的 小 数 部 分 。 大 致 的 规格 化 范围 : 
2“” 一 2"”。 也 被 称 为 扩展 实数 (extended real) 


由 于 三 种 格式 比较 相似 ， 因 此 本 节 将 重点 关注 单 精度 格式 (图 12-1 )。32 位 数值 的 最 高 
有 效 位 ( MSB) 在 最 左边 。 标 注 为 小 数 ( fraction) 的 字段 表示 的 是 有 效 数字 的 小 数 部 分 。 如 
同 预 想 的 一 样 ， 各 个 字 节 按照 小 端 顺 序 (最 低 有 效 位 ( LSB) 在 起 始 ee 
Se 

如 果 符 号 位 为 1， 则 该 数 为 负 ; 如 果 符 号 位 为 0， 则 该 数 为 正 。 符号 
零 被 认为 是 正 数 。 图 12-1 单 精度 格式 

2. 有 效 数 字 

在 浮 点 数 表 达 式 m*b* 中 ，m 称 为 有 效 数 字 或 尾数 ; b 为 基数 ; e 为 阶 码 。 浮 点 数 的 有 效 
数字 (或 尾数 ) 由 小 数 点 左右 的 十 进 制 数字 构成 。 本 书 第 1 章 在 解释 二 进 制 、 十 进 制 和 十 六 
进 制 计数 系统 时 ， 介 绍 了 加 权 位 计数 法 的 概念 。 同 样 的 概念 也 可 以 扩展 到 浮 点 数 的 小 数 部 
分 。 例 如 ， 十进制 数 123.154 可 以 表示 为 下 面 的 累加 和 形式 : 

123.154= (1xX10°)+ (2x10')+ (3x10°)+ (1xX10")+ (5x10°)(4x10") 











双 精 度 
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小 数 点 左边 数字 的 阶 码 都 为 正 ， 右 边 数 字 的 阶 码 都 为 负 。 
二 进 制 浮 点 数 也 可 以 使 用 加 权 位 计数 法 。 浮 点 数 十 进 制 数值 11.1011 表示 为 : 
11.1011= ( 1X2 ) F(TX2) FT (IX2 NO0X2)4 (IX2) 二 (LEX2) 

小 数 点 右边 的 数字 还 有 一 种 表达 方式 ， 即 将 它们 列 为 分 数 之 和 ， 其 中 分 母 为 2 的 军 。 上 

例 的 和 为 11/16 (或 0.6875 ): 
.1011=1/2+0/4+1/8+1/16=11/16 

生成 的 小 数 部 分 非常 直观 。 十 进 制 分 子 (11 ) 表示 的 就 是 二 进 制 位 组 合 1011。 如 果 小 
数 点 右边 的 有 效 位 个 数 为 e， 则 十 进 制 分 母 就 为 2。 上 例 中 ，e=4， 则 有 2“=16。 表 12-2 列 
出 了 更 多 的 例子 ,来 展示 将 二 进 制 浮 点 数 转换 为 以 10 为 基数 的 分 数 。 表 中 最 后 一 项 为 23 位 
规格 化 有 效 数字 可 以 保存 的 最 小 分 数 。 为 便于 参考 ， 表 12-3 列 出 了 二 进 制 浮 点 数 及 其 等 价 
的 十 进 制 分 数 和 十 进 制 数值 。 

表 12-2 示例 : 二 进 制 浮 点 数 转 换 为 分 数 

Ei 
| 133764 | 0.00000000000000000000001 | 


13 37/64 0.00000000000000000000001 












基数 为 10 的 分 数 


101.0011 
1101.100101 


1 3/8 
1/8388608 





表 12-3 让 全 二 生机 人 下 


十 进 制 分 数 十 进 制 数值 十 进 制 分 数 十 进 制 数值 
光臣 ee i 





3. 有 效 数字 的 精度 

用 有 限 位 数 表示 的 任何 浮 点 数 格 式 都 无 法 表示 完整 连续 的 实数 。 例 如 ， 假 设 一 个 简单 的 
浮 点 数 格式 有 5 位 有 效 数字 ， 那 么 将 无 法 表示 范围 在 1.1111 ~ 10.000 之 间 的 二 进 制 数 。 比 
如 ， 二 进 制 数 1.11111 就 需要 更 精确 的 有 效 数字 。 将 这 个 思想 扩展 到 IEEE 双 精 度 格式 ， 就 
会 发 现 其 53 位 有 效 数字 无 法 表示 需要 54 位 或 更 多 位 的 二 进 制 数 值 。 


12.1.2 ” 阶 码 


单 精 度数 用 8 位 无 符号 整数 存放 阶 码 ， 引 入 的 偏差 为 127， 因 此 必须 在 数 的 实际 阶 
码 上 再 加 127。 考 虑 二 进 制 数值 1.101 x 2 : 将 实际 阶 码 (5) 加 上 127 后， 形成 的 偏 移 码 
(132 ) 保存 到 数据 表示 形式 中 。 表 12-4 给 出 了 阶 码 的 有 符号 十 进 制 、 偏 移 十 进 制 ， 以 及 最 

一 列 的 无 符号 二 进 制 。 偏 移 码 总 是 正 数 ， 范 围 为 1 ~ 254。 如 前 所 述 ， 实 际 阶 码 的 范围 
为 -126 ~ +127。 这 个 经 过 选择 的 范围 ， 使 得 最 小 可 能 阶 码 的 倒数 也 不 会 发 生 溢出 。 
表 12-4 二进制 阶 码 表示 示例 
too00100 | 27 | 254 | 
EE CT EE ll， 
ii | | 2 | 


12.1.3 ”规格 化 二 进 制 浮 点 数 
大 多 数 二 进 制 浮 点 数 都 以 规格 化 格式 ( normalized form) 存放 ， 以 便 将 有 效 数字 的 精度 
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最 大 化 。 给 定 任 意 二 进 制 浮 点 数 ， 都 可 以 进行 规格 化 ， 方 法 是 将 二 进 制 小 数 点 移 位 ， 直 到 小 
数 点 左边 只 有 一 个 “1”。 阶 码 表示 的 是 二 进 制 小 数 点 向 左 ( 正 阶 码 ) 或 向 右 〈 负 阶 码 ) 移动 
的 位 数 。 示 例如 下 : 


1.1101 x2: 





1010001. | 1.010001 x 2° 


反 规格 化 数 ”规格 化 操作 的 逆 操 作 是 将 二 进 制 浮 点 数 反 规 格 化 denormalize) (或 非 规格 
化 (unnormalize))。 移 动 二 进 制 小 数 点 ， 直 到 阶 码 为 0。 如 果 阶 码 为 正 数 n， 则 将 二 进 制 小 数 
点 右 移 n 位 ; 如 果 阶 码 为 负数 n， 则 将 二 进 制 小 数 点 左 移 n 位 ， 并 在 需要 位 置 填充 前 导数 0。 


12.1.4 ”新 建 IEEE 表示 


实数 编码 

一 旦 符号 位 、 阶 码 和 有 效 数字 字段 完成 规格 化 和 编码 后 ， 生 成 一 个 完整 的 二 进 制 IEEE 
段 实数 就 很 容易 了 。 以 图 12-1 为 参考 ， 首 先 将 设置 符号 位 ， 然 后 是 阶 码 字段 ， 最 后 是 有 效 
数字 的 小 数 部 分 。 例 如 ， 下 面 表示 的 是 二 进 制 1.101 x 2": 

@ 符号 位 : 0 

e 阶 码 : 01111111 

e 小 数 部 分 : 10100000000000000000000 

偏 移 码 (01111111 ) 是 十 进 制 数 127 的 二 进 制 形 式 。 所 有 规格 化 有 效 数字 在 二 进 制 小 数 
点 的 左边 都 有 个 1， 因 此 ， 不 需要 对 这 一 位 进行 显 式 编码 。 更 多 的 例子 参见 表 12-5。 

表 12-5 单 精度 数位 编码 示例 


二 进 制 数值 符号 、 阶 码 、 小 数 部 分 

-1.11 1 01111111 11000000000000000000000 
+1101.101 0 10000010 10110100000000000000000 
—.00101 1 1 01111100 01000000000000000000000 
+100111.0 0 10000100 00111000000000000000000 
+.0000001101011 0 01111000 10101100000000000000000 

IEEE 规范 包含 了 多 种 实数 和 非 数字 编码 。 

。 正 零 和 负 零 

。 非 规格 化 有 限 数 

。 规格 化 有 限 数 

。 正 无 穷 和 负 无 穷 

。 非 数 字 (NaN， 即 不 是 一 个 数字 (Not a Number) ) 

e 不 定数 


不 定数 被 浮 点 单元 (FPU) 用 于 响应 一 些 无 效 的 浮 点 操作 。 

规格 化 和 非 规格 化 ”规格 化 有 限 数 (normalized finite numbers) 是 指 所 有 非 零 有 限 值 ， 
这 些 数 能 被 编码 为 零 到 无 穷 之 间 的 规格 化 实数 。 尽 管 看 上 去 全 部 有 限 非 零 浮 点 数 都 应 被 规格 
化 ,但 是 若 数值 接近 于 零 ， 则 无 法 规格 化 。 当 阶 码 范围 造成 的 限制 使 得 FPU 不 能 将 二 进 制 
小 数 点 移动 到 规格 化 位 置 时 ， 就 会 发 生 这 种 情况 。 假 设 FPU 计算 结果 为 1.0101111 x 2 …”， 
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其 阶 码 太 小 ， 无 法 用 单 精度 数 形式 存放 。 此 时 产生 一 个 下 溢 异 常 ， 数 值 则 每 次 将 二 进 制 小 数 
点 左 移 一 位 逐步 进行 非 规格 化 ， 直 到 阶 码 达 到 有 效 范 围 : 


.01011110000000000001111 x 2-129? 
.10101111000000000000111 x 2-128 
.01010111100000000000011 x 2-12?7 
.00101011110000000000001 x 2-126 

在 这 个 例子 中 ， 移 动 二 进 制 小 数 点 导致 有 效 数 字 损失 了 精度 。 

正 无 穷 和 负 无 穷 ” 正 无 穷 (+ o ) 表示 最 大 正 实数 ， 负 无 穷 (- % ) 表示 最 大 负 实 数 。 无 
穷 可 以 与 其 他 数值 比较 : - wm 小 于 + om ，- om 小 于 任意 有 限 数 ，+ o 大 于 任意 有 限 数 。 任 一 
无 穷 都 可 以 表示 浮 点 溢出 条 件 。 运 算 结果 不 能 规格 化 的 原因 是 ， 结 果 的 阶 码 太 大 而 无 法 用 有 
效 阶 码 位 数 来 表示 。 

NaN NaN 是 不 表示 任何 有 效 实数 的 位 模式 。x86 有 两 种 NaN : quiet NaN 能 够 通过 大 
多 数 算术 运算 来 传递 ， 而 不 会 引起 异常 。signaling NaN 则 被 用 于 产生 一 个 浮 点 无 效 操作 异 
常 。 编 译 器 可 以 用 signaling NaN 填充 未 初始 化 数组 ， 那 么 ,任何 试图 在 这 个 数组 上 执行 的 
运算 都 会 引发 异常 。quiet NaN 可 以 用 于 
保存 在 调试 期 间 生成 的 诊断 信息 。 程 序 可 te 
根据 需要 自由 地 在 NaN 中 编 和 任何 信息 。 本 

公 尾 } 行 3 
Re ed ee 1 00000000 00000000000000000000000 
3 0 11111111 00000000000000000000000 

数 的 指令 结果 ?。 1 11111111 00000000000000000000000 

特定 编码 在 浮 点 运算 中 ， 常常 会 出 现 X 11111111 1xxxxxxxxXXXXXXXXXXXXXXX 
一 些 特定 的 数值 编码 ， 如 表 12-6 所 示 。 字 x 11111111 0xcoooooooooooooooOOOCX 
母 x 表 示 的 位 ， 其 值 可 以 为 1， 也 可 以 为 0。 
QNaN 是 quiet NaN，SNaN 是 signaling NaN。 


12.1.5 ”十进制 小 数 转换 为 二 进 制 实数 


当 十 进 制 小 数 可 以 表示 为 形 如 ( 1/2+1/4+1/8+… ) 的 分 数 之 和 时 ， 发 现 与 之 对 应 的 二 进 
制 实数 就 非常 容易 了 。 如 表 12-7 所 示 ， 左 列 中 的 大 多 数 分 数 不 容 易 转换 为 二 进 制 。 不 过 ， 
可 以 将 它们 写成 第 二 列 的 形式 。 
表 12-7 “十进制 分 数 与 二 进 制 实数 示例 


ED 
i 
mm | mm | wm | we | 
EE ET ET 
em | mm | | | 
很 多 实数 ， 如 1/10( 0.1) 或 /100 (0.01 )， 不 能 表示 为 有 限 位 的 二 进 制 数 ， 它 们 只 能 
近似 地 表示 为 一 组 以 2 的 究 为 分 母 的 分 数 之 和 。 想 想 看 ， 像 $39.95 这 样 的 货币 值 受 到 了 怎 
样 的 影响 ! 
另 一 种 方法 : 使 用 二 进 制 长 除法 ” 当 十 进 制 数 比较 小 的 时 候 ， 将 十 进 制 分 数 转换 为 二 进 


OOOO 













Positive zero 






Negative zero 






Positive infinity 





Negative infinity 


@ SNaN 的 有 效 数字 字段 从 0 开始 ， 且 剩余 位 中 至 
少 有 一 位 必须 为 1。 















.011 


1/8 





.0101 


S16 
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制 的 一 个 简单 方法 就 是 : 先 将 分 子 与 分 母 转换 为 二 进 制 ， 再 执行 长 除 。 例 如 ， 十 进 制 数 0.5 
表示 为 分 数 就 是 5/10， 那 么 十 进 制 5 等 于 二 进 制 0101， 十 进 制 10 等 于 二 进 制 1010。 执 行 


了 长 除 之 后 ， 商 为 二 进 制 数 0.1: 
1 
1010| 0101.0 
-1010 


0 


当 被 除数 减 去 除数 1010 的 结果 为 0 时 ， 除 法 完成 。 因 此 ， 十 进 制 分 数 5/10 等 于 二 进 制 
数 0.1。 这 种 方法 被 称 为 二 进 制 长 除法 (binary long division method) ’。 
用 二 进 制 表示 0.2 下面 用 二 进 制 长 除法 将 十 进 制 数 0.2( 2/10 ) 转换 为 二 进 制 数 。 首 先 ， 
用 二 进 制 10 除 以 二 进 制 1010 (十 进 制 10 ): 
.00110011 ( 略 ) 
1010| 10.00000000 
1010 
1100 
1010 
10000 
_1010 
1100 
1010 
赂 
第 一 个 足够 大 到 能 上 商 的 数 是 10000。 从 10000 减 去 1010 后 ,余数 为 110。 添 加 一 个 
0 后 ， 形 成 新 的 被 除数 1100。 从 1100 减 去 1010 后 ， 余 数 为 10。 添 加 三 个 0 后， 形成 新 的 
被 除数 10000。 这 个 数 与 第 一 个 被 除数 相同 。 从 这 里 开始 ， 商 的 位 序列 出 现 重 复 (0011… )， 
由 此 可 知 ， 不 会 得 到 确定 的 商 ， 所 以 ，0.2 也 不 能 表示 为 有 限 位 的 数 。 其 单 精度 编码 的 有 效 
数字 为 10011001100110011001100。 
1. 单 精 度数 转换 为 十 进 制 
IEEE 单 精度 数 转 换 为 十 进 制 时 ， 建 议 步骤 如 下 : 
1 ) 若 MSB 为 1， 该 数 为 负 ; 否则 ， 该 数 为 正 。 
2 ) 其 后 8 位 为 阶 码 。 从 中 减 去 二 进 制 值 01111111 (十 进 制 数 127 )， 生 成 无 偏差 阶 码 。 
将 无 偏差 阶 码 转 换 为 十 进 制 。 
3 ) 其 后 23 位 表示 有 效 数字 。 添 加 “1.”"， 后面 紧 跟 有 效 数 字 位 ， 尾 随 零 可 以 忽略 。 用 
形成 的 有 效 数 字 、 第 一 步 得 到 的 符号 和 第 二 步 计 算出 来 的 阶 码 ， 就 构成 一 个 二 进 制 浮 点 数 。 
4 ) 对 第 三 步 生 成 的 二 进 制 数 进行 非 规格 化 。( 按 照 阶 码 的 值 移动 二 进 制 小 数 点 。 如 果 阶 
码 为 正 ， 则 右 移 ; 如 果 阶 码 为 负 ， 则 左 移 。) 
5 ) 利用 加 权 位 计数 法 ， 从 左 到 右 ， 将 二 进 制 浮 点 数 转 换 为 2 的 寡 之 和 ， 形 成 十 进 制 数 。 
2. 示例 : IEEE ( 0 10000010 01011000000000000000000 ) 转换 为 十 进 制 
1 ) 该 数 为 正 数 。 
2 ) 无 偏差 阶 码 的 二 进 制 值 为 00000011， 十 进 制 值 为 3。 
3 ) 将 符号 、 阶 码 和 有 效 数 字 组 合 起 来 即 得 该 二 进 制 数 为 +1.01011 x 2;。 
4 ) 非 规 格 化 二 进 制 数 为 +1010.11。 


5 ) 则 该 数 的 十 进 制 值 为 +103 ,或 +10.75。 
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12.1.6 ”本 节 回 顾 


1. 为 什么 单 精度 实数 格式 中 的 阶 码 不 能 为 -127 ? 

2. 为 什么 单 精度 实数 格式 中 的 阶 码 不 能 为 +128 ? 

3. IEEE 双 精 度 格式 中 ， 用 多 少 位 表示 有 效 数 字 的 小 数 部 分 ? 
4. IEEE 单 精度 格式 中 ， 用 多 少 位 表示 阶 码 ? 


12.2” 浮 点 单元 


Intel 8086 处 理 器 的 设计 使 之 只 能 处 理 整数 运算 。 这 对 于 使 用 浮 点 运算 的 图 形 和 计算 密 
集 型 软件 来 说 就 变 成 了 麻烦 。 尽 管 也 可 以 纯粹 地 通过 软件 来 模拟 浮 点 运算 ， 但 这 样 会 带 来 严 
重 的 性 能 损失 。 像 AutoCad (来 自 Autodesk 公司 ) 这 样 的 应 用 程序 要 求 用 更 强大 的 方法 来 
执行 浮 点 运算 。Intel 发 售 了 一 款 独立 浮 点 协 处 理 器 芯片 8087， 它 与 每 一 代 处 理 器 一 起 升级 。 
当 Intel 486 出 现时 ， 浮 点 硬件 就 被 集成 到 主 CPU 中 ， 称 为 FPU。 


12.2.1 FPU 寄存 器 栈 


FPU 不 使 用 通用 寄存 器 ( EAX、EBX 等 等 )。 反 之 ， 它 有 自己 的 一 组 寄存 器 ， 称 为 寄存 
器 栈 ( register stack) 。 数 值 从 内 存 加 载 到 寄存 器 栈 ， 然 后 执行 计算 ， 再 将 堆栈 数值 保存 到 内 
存 。FPU 指令 用 后 组 (postfix) 形式 计算 算术 表达 式 ， 这 和 惠普 计算 器 的 方法 大 致 相同 。 比 
如 ， 现 有 一 个 中 组 表达 式 (infix expression): ( 5*6 ) +4， 其 后 缀 表达 式 为 


5 


中 组 表达 式 ( A+B) *C 要 用 括号 来 覆盖 默认 的 优先 级 规则 (乘法 在 加 法 之 前 )。 与 之 等 
效 的 后 缀 表达 式 则 不 需要 括号 : 


9 才 它 似 


表达 式 堆 栈 在 计算 后 缀 表达 式 的 过 程 中 ， 用 堆栈 来 保存 中 间 结 果 。 图 12-2 展示 了 计 
算 后 缀 表达 式 56*4- 所 需 的 步 又。 堆栈 条 目 被 标记 为 ST (0) 和 ST (1)， 其 中 ST (0) 表 
示 堆 栈 指针 通常 所 指 位 置 。 


从 左 到 右 堆栈 操作 
5 ST(0) 5 人 栈 
56 [5 ] ST(1) 6 入 栈 
ST(0) 
5 6* ST(0) ST(0) 乘 以 ST( 1),ST(0) 弹出 堆栈 。 
5 6*4 ST(1) 4 人 栈 
到 
5 6*4- ST(0) ST( 1 ) 减 去 ST(0),ST(0 ) 弹出 堆栈 。 
图 12-2 计算 后 缀 表达 式 56*4- 


中 缀 表达 式 转 换 为 后 缀 表达 式 的 常见 方法 在 互联 网 以 及 计算 机 科学 人 门 读物 中 都 可 以 查 
阅 到 ， 此 处 不 再 闭 述 。 表 12-8 给 出 了 一 些 等 价 表达 式 。 

1. FPU 数据 寄存 器 

FPU 有 8 个 独立 的 、 可 寻 址 的 80 位 数据 寄存 器 R0 ~ R7 (参见 图 12-3 )， 这 些 寄存 器 
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合 称 为 寄存 器 栈 。FPU 状态 字 中 名 为 TOP 的 一 个 3 位 字段 给 出 了 当前 处 于 栈 顶 的 寄存 器 纺 


号 。 例 如 ， 在 图 12-3 中 ，TOP 等 于 二 进 制 数 011， 这 表示 栈 顶 为 R3。 在 编写 浮 点 指令 时 ， 
这 个 位 置 也 称 为 ST ( 0 )( 或 简写 为 ST)。 最 后 一 个 寄存 器 为 ST (7 )。 


表 12-8 中 纺 转 为 后 绥 的 例子 


如 同 所 想 的 一 样 ， 入 栈 (push) 操作 (也 称 为 加 载 ) ee 。 
将 TOP 减 1， 并 把 操作 数 复制 到 标识 为 ST (0) 的 寄存 R7 ST(4) 





器 中 。 如 果 在 人 栈 之 前 ，TOP 等 于 0， 那么 TOP 就 回 绕 个 R6 STG) 
到 寄存 器 R7。 出 栈 (pop) 操作 (也 称 为 保存 ) 把 ST (0) Pop Ri 
的 数据 复制 到 操作 数 ， 再 将 TOP 加 1。 如 果 在 出 栈 之 前 ， Push R3 ST(0) < 一 TOP=011 


R2 STO7) 
RI ST(6) 
RO ST(5) 


TOP 等 于 7， 则 TOP 就 回 绕 到 寄存 器 R0。 如 果 加 载 到 堆 
栈 的 数值 覆盖 了 寄存 器 栈 内 原 有 的 数据 ， 就 会 产生 一 个 浮 
点 异常 (floating-point exception)。 图 12-4 展示 了 数据 1.0 


图 12-3 浮 点 数据 寄存 器 栈 
和 2.0 人 栈 后 的 堆栈 情况 。 





图 12-4 1.0 和 2.0 入 栈 后 的 FPU 栈 


尽管 理解 FPU 如 何 用 一 组 有 限 数量 的 寄存 器 实现 堆栈 很 有 意思 ， 但 这 里 只 需 关注 ST (n)， 
其 中 ST (0 ) 总 是 表示 栈 顶 。 从 这 里 开始 ， 引 用 栈 寄 存 器 时 将 使 用 ST (0)，ST (1 )， 以 此 
类 推 。 指 令 操作 数 不 能 直接 引用 寄存 器 编号 。 

寄存 器 中 浮 点 数 使 用 的 是 IEEE 10 字 节 扩展 实数 格式 (也 被 称 为 临时 实数 (temporary 
real) )。 当 FPU 把 算术 运算 结果 存 人 内 存 时 ， 它 会 把 结果 转换 成 如 下 格式 之 一 : 整数 、 长 整 
数 、 单 精度 ( 短 实数 )、 双 精度 (长 实数 )， 或 者 压缩 二 进 制 编码 的 十 进 制 数 (BCD)。 

2. 专用 寄存 器 


10 0 


FPU 有 6 个 专用 (Special-purpose) 寄存 器 (参见 图 12-5 ): 吕 

e 人 保存 最 后 执行 的 非 控制 指令 的 操作 

| 业态 | 

e 控制 寄存 器 : 执行 运算 时 ， 控 制 精度 以 及 FPU 使 
用 的 舍 信 方法。 还 可 以 用 这 个 寄存 器 来 屏蔽 ( 隐 

藏 ) 单个 浮 点 异常。 


。 状态 寄存 器 : 包含 栈 顶 指针 、 条 件 码 和 异常 警告 。 
e 标识 寄存 器 : 指明 FPU 数据 寄存 器 栈 内 每 个 寄存 图 12-5 FPU 专用 寄存 器 
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器 的 内 容 。 其 中 ， 每 个 寄存 器 都 用 两 位 来 表示 该 寄存 器 包含 的 是 一 个 有 效 数 、 零 、 
特殊 数值 (NaN、 无 穷 、 非 规格 化 ， 或 不 支持 的 格式 )， 还 是 为 空 。 
。 最 后 指令 指针 寄存 器 : 保存 指向 最 后 执行 的 非 控制 指令 的 指针 。 
。 最 后 数据 (操作 数 ) 指针 寄存 器 : 保存 指向 数据 操作 数 的 指针 ， 如 果 存 在 ， 那 么 该 数 
被 最 后 执行 的 指令 所 使 用 。 
操作 系统 使 用 这 些 专用 寄存 器 在 任务 切换 时 保存 状态 信息 。 本 书 第 2 章 在 解释 CPU 如 
何 执行 多 任务 时 提 到 过 状态 保存 。 


12.2.2 使 入 


FPU 尝试 从 浮 点 计算 中 产生 非常 精确 的 结果 。 但 是 ， 在 很 多 情况 下 这 是 不 可 能 的 ， 因 
为 目标 操作 数 可 能 无 法 精确 表示 计算 结果 。 比 如 ， 假 设 现 有 一 特定 存储 格式 只 允许 3 个 小 数 
位 。 那 么 ， 该 格式 可 以 保存 形 如 1.011 或 1.101 的 数值 ， 而 不 能 保存 形 如 1.0101 的 数值 。 若 
计算 的 精确 结果 为 +1.0111 (十 进 制 数 1.4375 )， 那 么 ， 既 可 以 通过 加 0.0001 向 上 伟人 该 数 ， 
也 可 以 通过 减 0.0001 向 下 伟人 : 

(a) 1.0111 一 1.100 

(b) 1.0111 一 1.011 

若 精确 结果 是 负数 ， 那 么 加 -0.0001 会 使 舍 人 结果 更 接近 - om 。 而 减 去 -0.0001 会 使 合 
人 结果 更 接近 0 和 + o: 

(a) —1.0111 一 —1.100 

(b) -1.0111 一 —1.011 

FPU 可 以 在 四 种 伟人 方法 中 进行 选择 : 

@ 舍 入 到 最 接近 的 偶数 (round to nearest even) : 伟人 结果 最 接近 无 限 精确 的 结果 。 如 

果 有 两 个 值 近似 程度 相同 ， 则 取 偶 数值 (LSB=0 ) 。 

@ 向 一 使 入 (round downto 一 o ): 舍 人 结果 小 于 或 等 于 无 限 精确 结果 。 

@ 向 +o 舍 入 (round down to + wm): 舍 人 结果 大 于 或 等 于 无 限 精 确 结果 。 

@ 向 0 使 入 (round toward zero) :〈 也 被 称 为 截断 法 ) : 舍 人 结果 的 绝对 值 小 于 或 等 于 无 

限 精 确 结果 。 

FPU 控制 字 FPU 控制 字 用 两 位 指明 使 用 的 舍 入 方法 ， 这 两 位 被 称 为 RC 字段 ， 字 段 
数值 (二进制 ) 如 下 : 

e 00: 舍 人 到 最 接近 的 偶数 (默认 )。 

e 01: 向 负 无 穷 舍 人 。 

e 10: 向 正 无 穷 舍 信 。 

e 11: 向 0 伟人 (截断 )。 

合 入 到 最 接近 的 偶数 是 默认 选择 ， 它 被 认为 是 最 精确 的 ， 也 最 适合 大 多 数 应 用 程序 。 
表 12-9 以 二 进 制 数 +1.0111 为 例 ， 展 示 了 四 种 舍 信 方法。 同样 ， 表 12-10 展示 了 二 进 制 
数 -1.0111 的 舍 人 结果 。 

表 12-9 示例 : +1.0111 的 舍 入 


方法 会 入 结果 
合 人 到 最 接近 的 偶数 | 1011 | 1100 | 向 + 全 和 | 10m | 1lo0 
向 -mw 合 人 | wu | to mosA | wm | 1on 





414 务 12 尝 


表 12-10 示例 : -1.0111 的 舍 入 


om -um 
om | oo ass 和 | -on 






合 入 结果 












会 人 到 最 接近 的 ( 偶 ) 数 


12.2.3” 浮 点 数 异常 


每 个 程序 都 可 能 出 错 ， 而 FPU 就 需要 处 理 这 些 结 果 。 因 而 ， 它 要 识别 并 检测 6 种 类 型 
的 异常 条 件 : 无 效 操作 ( 放 )、 除 零 ( 刀 )、 非 规格 化 操作 数 (#D)、 数 字 上 溢 (#0)、 数 字 下 
溢 (#U)， 以 及 模糊 精度 (#P)。 前 三 个 ( 担 、# 纪 和 #D) 在 全 部 运算 操作 发 生前 进行 检测 ， 
后 三 个 (#0O、#U 和 #P) 则 在 操作 发 生 后 检测 。 

每 种 异常 都 有 对 应 的 标志 位 和 屏蔽 位 。 当 检测 到 浮 点 异常 时 ， 处 理 器 将 与 之 匹配 的 标志 
位 置 1。 每 个 被 处 理 器 标记 的 异常 都 有 两 种 可 能 的 操作 : 

e 如 果 相 应 的 屏蔽 位 置 1， 那 么 处 理 器 自动 处 理 异常 并 继续 执行 程序 。 

e 如 果 相 应 的 屏蔽 位 清 0， 那 么 处 理 器 将 调用 软件 异常 处 理 程序 。 

大 多 数 程序 普遍 都 可 以 接受 处 理 器 的 屏蔽 (自动 ) 响应 。 如 果 应 用 程序 需要 特殊 响应 ， 
那么 可 以 使 用 自 定义 异常 处 理 程序 。 一 条 指令 能 触发 多 个 异常 ， 因 此 处 理 器 要 持续 保存 自 上 
一 次 异常 清 零 后 所 发 生 的 全 部 异常 。 完 成 一 系列 计算 后 ， 可 以 检测 是 否 发 生 了 异常 。 


12.2.4 浮 点 数 指令 集 


FPU 指令 集 有 些 复杂 ， 因 此 本 节 尝 试 对 其 功能 进行 概述 ， 并 用 具体 例子 给 出 编译 器 通常 
会 生成 的 代码 。 此 外 ， 本 节 还 将 看 到 如 何 通过 改变 舍 人 模式 来 控制 FPU。 指 令 集 包括 如 下 基 
本 指令 类 型 : 

e 数据 传送 

。 基本 算术 运算 

e 比较 

e 超越 函数 

e 常数 加 载 ( 仅 对 专门 预定 义 的 常数 ) 

e x87 FPU 控制 

e x87 FPU 和 SIMD 状态 管理 

浮 点 指令 名 用 字母 F 开头 ， 以 区 别 于 CPU 指令 。 指 令 助 记 符 的 第 二 个 字母 (通常 为 B 
或 1) 指明 如 何 解 释 内 存 操 作 数 : B 表示 BCD 操作 数 ，I 表示 二 进 制 整数 操作 数 。 如 果 这 两 
个 字母 都 没有 使 用 ， 则 内 存 操作 数 将 被 认为 是 实数 。 比 如 ，FBLD 操作 对 象 为 BCD 数值 ， 
FILD 操作 对 象 为 整数 ， 而 FLD 操作 对 象 为 实数 。 





操作 数 ” 浮 点 指令 可 以 包含 零 操 作 数 、 单 操作 数 和 双 操 作 数 。 如 果 是 双 操 作 数 ， 那 么 
其 中 一 个 必然 为 浮 点 寄存 器 。 指 令 中 没有 立即 操作 数 ， 但 是 某 些 预 定义 常数 (如 0.0， 和 
log210 ) 可 以 加 载 到 堆栈 。 通 用 寄存 器 EAX、EBX、ECX 和 EDX 不 能 作为 操作 数 。( 唯 一 的 
例外 是 FSTSW ， 它 将 FPU 状态 字 保 存在 AX 中 。) 不 允许 内 存 - 内 存 操作 。 

整数 操作 数 从 内 存 (不 是 从 CPU 寄存 器 ) 加 载 到 FPU， 并 自动 转换 为 浮 点 格式 。 同 样 ， 
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将 浮 点 数 保存 到 整数 内 存 操作 数 时 ， 该 数值 也 会 被 自动 截断 或 会 人 为 整数 。 

1. 初始 化 (FINIT ) 

FINIT 指令 对 FPU 进行 初始 化 。 将 FPU 控制 字 设 置 为 037Fh， 即 屏蔽 (隐藏) 了 所 有 浮 
点 异常 ; 伟人 模式 设置 为 最 近 偶数 ， 计 算 精 度 设置 为 64 位 。 建 议 在 程序 开始 时 调用 FINIT， 
这 样 就 可 以 了 解 处 理 器 的 起 始 状态 。 

2. 浮 点 数据 类 型 

现在 快速 回顾 一 下 MASM 支持 的 浮 点 数据 类 型 (QWORD、TBYTE、REAL4、REAL8 
和 REAL10 )， 如 表 12-11 所 示 。 在 定义 FPU 指令 
的 内 存 操作 数 时 ， 将 会 使 用 到 这 些 类 型 。 例 如 ， 加 
载 一 个 浮 点 变量 到 FPU 堆栈 ， 这 个 变量 可 以 定义 为 
REAL4，REAL8 或 REAL10: 


.data 32 位 (4 字 节 ) IEEE 短 实数 
bigvVal RERAL10 1.212342342234234243E+864 64 位 (8 字 节 ) IEEE 长 实数 
; 加 载 变 量 到 堆栈 80 位 (10 字 节 ) IEEE 扩展 实数 
3. 加 载 浮 点 数值 (FLD ) 
FLD (加 载 浮 点 数值 ) 指令 将 浮 点 操作 数 复制 到 FPU 堆栈 栈 顶 ( 称 为 ST (0 ))。 操 作 数 
可 以 是 32 位、64 位 、80 位 的 内 存 操作 数 (REAL4、REAL8、REAL10 ) 或 男 一 个 FPU 寄存 器 : 


表 12-11 内 部 数据 类 型 


80 位 (10 字 节 ) 整数 





FLD m32fp 

FLD m6dfp 

FLD m80fp 

FLD ST(i) 

内 存 操 作 数 类 型 ”FLD 支持 的 内 存 操作 数 类 型 与 MOV 指令 一 样 。 示 例如 下 : 524 
-data 

array REAL8 10 DUP(?) 

‘Code 

fld array ; 直接 寻 址 

fld [array+16] 7 直接 偏 移 

fld REAL8 PTR[esil ; 间接 寻 址 

fld array[esil ; 变 址 寻 址 

fld array[esix81] ; 带 比 例 因子 的 变 址 
fld array[esi*TYPE array] ; 带 比 例 因 子 的 变 址 
fld REALS8 PTR|ebx+t+esi] ; 基 址 - 变 址 

fld array[lebx+tesi] ; 基 址 - 变 址 - 偏 移 量 


fld array[ebxtesi*TYPE array] ; 带 比 例 因 子 的 基 址 - 变 址 -~ 偏 移 量 
示例 下 面 的 例子 加 载 两 个 直接 操作 数 到 FPU 堆栈 : 


data 
dbloOne RERAL8 234.56 
dblTwo REAL8 10.1 


.Code 
fld dbLone ; ST(0) = dblone 
fld dblTwo ; ST(0) = dblTwo, ST(1) = dblOne 


每 条 指令 执行 后 的 堆栈 情况 如 下 图 所 示 : 


fd dblOne ST(0) [234.56 
fd dblTwo ST(1) 
ST(0) [| 10.1 | 
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执行 第 二 条 FLD 时 , TOP 减 1， 这 使 得 之 前 标记 为 ST ( 0 ) 的 堆栈 元 素 变 为 了 ST (1 )。 
FILD FILD (加 载 整 数 ) 指令 将 16 位 、32 位 或 64 位 有 符号 整数 源 操作 数 转 换 为 双 精 
度 浮 点 数 ， 并 加 载 到 ST (0 )。 源 操作 数 符号 保留 ， 其 用 法 将 在 12.2.10 节 (混合 模式 运算 ) 
进行 说 明 。FILD 支持 的 内 存 操作 数 类 型 与 MOV 指令 一 致 (间接 、 变 址 、 基 址 - 变 址 等 ) 。 
加 载 常数 下 面 的 指令 将 特定 常数 加 载 到 堆栈 。 这 些 指令 没有 操作 数 : 
e FLD1 指令 将 1.0 压 入 寄存 器 堆栈 。 
FLDL2T 指令 将 log,10 压 人 寄存 器 堆栈 。 
FLDL2E 指令 将 logze 压 人 寄存 器 堆栈 。 
FLDPI 指令 将 压 和 人 寄存 器 堆栈 。 
FLDLG2 指令 将 log1o2 压 人 寄存 器 堆栈 。 
FLDLN2 指令 将 log.2 压 入 寄存 器 堆栈 。 
FLDZ (加 载 零 ) 指令 将 0.0 压 人 FPU 堆栈 。 
. 保存 浮 点 数值 (FST，FSTP) 
FST (保存 浮 点 数值 ) 指令 将 浮 点 操作 数 从 FPU 栈 顶 复制 到 内 存 。FST 支持 的 内 存 操 
作 数 类 型 与 FLD 一 致 。 操 作 数 可 以 为 32 位 、64 位 、80 位 内 存 操作 数 (REAL4、REAL8、 
REAL10 ) 或 男 一 个 FPU 寄存 器 : 


FST m32fp FST m80fp 

FST m64dfp FST ST(i) 

FST 不 是 弹出 堆栈 。 下 面 的 指令 将 ST ( 0 ) 保存 到 内 存 。 假 设 ST(0) 等 于 10.1,ST(1) 
等 于 234.56: 

fst dblThree 2 10.1 

fst dblFour | 


直观 地 说 ， 代 码 段 期 望 dblFour 等 于 234.56。 但 是 第 一 条 FST 指令 把 10.1 留 在 ST (0) 
中 。 如 果 代 码 段 的 意图 是 把 ST (1 ) 复制 到 dblFour， 那 么 就 要 用 FSTP 指令 。 

FSTP FSTP (保存 浮 点 值 并 将 其 出 栈 ) 指令 将 ST (0) 的 值 复制 到 内 存 并 将 ST (0) 
弹出 堆栈 。 假 设 执行 下 述 指令 前 ST (0 ) 等 于 10.1，ST (1 ) 等 于 234.56: 


fstp dblThree 7 -10a 
fstp dblFour ; 234.56 


指令 执行 后 ， 这 两 个 数值 会 从 堆栈 中 逻辑 移 除 。 从 物理 上 看 ， 每 次 执行 FSTP，TOP 指 
针 都 会 减 1， 修 改 ST (0 ) 的 位 置 。 

FIST (保存 整数 ) 指令 将 ST (0 ) 的 值 转换 为 有 符号 整数 ， 并 把 结果 保存 到 目标 操作 数 。 
保存 的 值 可 以 为 字 或 双 字 。 其 用 法 将 在 12.2.10 节 ( 混 
合 模式 运算 ) 进行 说 明 。FIST 支持 的 内 存 操作 数 类 型 与 


表 12-12 基本 浮 点 算术 运算 指令 
FST 一 致 。 
12.2.5 ”算术 运算 指令 源 操作 数 与 目的 操作 数 相 加 
从 目的 操作 数 中 减 去 源 操作 数 
表 12-12 列 出 了 基本 算术 运算 操作 。 所 有 算术 运算 指 从 源 操作 数 中 减 去 目的 操作 数 
令 支 持 的 内 存 操作 数 类 型 与 FLD (加 载 ) 和 FST (保存 ) 源 操作 数 与 目的 操作 数 相 乘 
一 致 ， 因 此 ， 操 作 数 可 以 是 间接 操作 数 、 变 址 操作 数 和 目的 操作 数 除 以 源 操作 数 





基 址 - 变 址 操作 数 等 等 。 源 操作 数 除 以 目的 操作 数 
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1. FCHS 和 FABS 
FCHS (修改 符号 ) 指令 将 ST (0 ) 中 浮 点 数值 的 符号 取 反 。FABS (绝对 值 ) 指令 清除 
ST (0 ) 中 数值 的 符号 ， 以 得 到 它 的 绝对 值 。 这 两 条 指令 都 没有 操作 数 : 


FCHS 
FABS 


2. FADD、FADDP、FIADD 
FADD (加 法 ) 指令 格式 如 下 ， 其 中 ，m32fp 是 REAL4 内 存 操作 数 ，m64fp 是 REAL8 
内 存 操作 数 ，i 是 寄存 器 编号 : 


FRDD4 

FADD m32fp 

FADD m64fp 

FADD ST(0), ST(i) 

FADD ST(i), ST(0) 

无 操作 数 ”如果 FADD 没有 操作 数 , 则 ST (0 ) 与 ST (1) 相 加 ， 结 果 暂 存在 ST (1 )。 
然后 ST (0 ) 弹出 堆栈 ， 把 加 法 结果 保留 在 栈 项 。 假 设 堆栈 已 经 包含 了 两 个 数值 ， 下 图 展示 


了 FADD 的 操作 : 
fadd 执行 前 ”ST(1) 


ST(0) 
执行 后 ST(0) 
寄存 器 操作 数 ”从 同样 的 栈 开 始 ， 如 下 所 示 将 ST (0 ) 加 到 ST (1 ): 


fadd st(1), st(0) ”执行 前 ”ST(1) 


sSTO | 101 | 
执行 后 “ST(1) 
ST(0) 
内 存 操 作 数 ”如 果 使 用 的 是 内 存 操 作 数 ，FADD 将 操作 数 与 ST (0 ) 相 加 。 示 例如 下 : 
fadd mySingle ; ST(0) += mySingle 
fadd REAL8 PTR[esi] ; ST(0) += [esi] $27 


FADDP FADDP ( 相 加 并 出 栈 ) 指令 先 执行 加 法 操作 ， 再 将 ST (0 ) 弹出 堆栈 。MASM 
支持 如 下 格式 : 


FADDP ST(i),ST(0) 
下 图 演示 了 FADDP 的 操作 过 程 : 
faddp st(1), st(0) ”执行 前 ”ST(1) 
ST(0) 
执行 后 ST(0) 
FIADD ”FIADD (整数 加 法 ) 指令 先 将 源 操作 数 转 换 为 扩展 双 精 度 浮 点 数 ， 再 与 ST (0 ) 
相 加 。 指 令 语法 如 下 : 


FIADD mi6int 
FIADD m32int 
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示例 : 

-data 

myInteger DWORD 1 

ee myInteger ; ST(0) += myInteger 

3.FSUB、 FSUBP、 FISUB 

FSUB 指令 从 目的 操作 数 中 减 去 源 操作 数 ， 并 把 结果 保存 在 目的 操作 数 中 。 目 的 操作 数 
总 是 一 个 FPU 寄存 器 ， 源 操作 数 可 以 是 FPU 寄存 器 或 者 内 存 操 作 数 。 该 指令 操作 数 类 型 与 
FADD 指令 一 致 : 

FSUB5 

FSUB m32fp 

FSUB m64dfp 

FSUB ST(0), ST(i) 

FSUB STULY TCO 

FSUB 的 操作 与 FADD 相似 ， 只 不 过 它 进行 的 是 减法 而 不 是 加 法 。 比 如 ， 无 参数 FSUB 
实现 ST (1 ) -ST (0 )， 结 果 暂 存 于 ST ( 1 )。 然 后 ST (0 ) 弹出 堆栈 ,将 减法 结果 留 在 栈 项 。 
若 FSUB 使 用 内 存 操作 数 ， 则 从 ST ( 0 ) 中 减 去 内 存 操作 数 ， 且 不 再 弹出 堆栈 。 

fsub mySingle ; ST(0) -= mySingle 

fsub array[edi*8] ; ST(0) -= array[edi*8] 

FSUBP FSUBP ( 相 减 并 出 栈 ) 指令 先 执行 减法 ， 再 将 ST (0 ) 弹出 堆栈 。MASM 支 
持 如 下 格式 : 


FSUBP ST(i),ST(0) 


FISUB FISUB (整数 减法 ) 指令 先 把 源 操作 数 转 换 为 扩展 双 精 度 浮 点 数 ， 再 从 ST (0 ) 
中 减 去 该 操作 数 : 

FISUB mlé6int 

FISUB m32int 

4. FMUL、 FMULP、 FIMUL 

FMUL 指令 将 源 操作 数 与 目的 操作 数 相 乘 ， 乘 积 保存 在 目的 操作 数 中 。 目 的 操作 数 总 
是 一 个 FPU 寄存 器 ， 源 操作 数 可 以 为 寄存 器 或 者 内 存 操作 数 。 其 语法 与 FADD 和 FSUB 
相同 : 

FMULS 

FMUL m32fp 

FMUL m64fp 


FMUL ST(0), ST(i) 
FMUL ST(i), ST(0) 


除了 执行 的 是 乘法 而 不 是 加 法 外 ，FMUL 的 操作 与 FADD 相同 。 比 如 ， 无 参数 FMUL 
将 ST(0) 与 ST(1) 相 乘 ， 乘积 暂 存 于 ST(1)。 然 后 ST(0) 弹出 堆栈 ， 将 乘积 留 在 栈 顶 。 
同样 ， 使 用 内 存 操作 数 的 FMUL 则 将 内 存 操作 数 与 ST ( 0 ) 相 乘 : 


fmul mySingle ; ST(0) *= mySingle 


FMULP FMULP ( 相 乘 并 出 栈 ) 指令 先 执 行 乘法 ， 再 将 ST (0 ) 弹出 堆栈 。MASM 支 
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持 如 下 格式 : 


FMULP ST(i),ST(0) 


FIMUL 与 FIADD 相同 ， 只 是 它 执行 的 是 乘法 而 不 是 加 法 : 

FIMUL miéint 

FIMUL m32int 

5. FDIV、FDIVP、FIDIV 

FDIV 指令 执行 目的 操作 数 除 以 源 操作 数 ， 被 除数 保存 在 目的 操作 数 中 。 目 的 操作 数 总 
是 一 个 寄存 器 ， 源 操作 数 可 以 为 寄存 器 或 者 内 存 操 作 数 。 其 语法 与 FADD 和 FSUB 相同 : 

FDIV7 

FDIV m32fp 

FDIV mé6dfp 

FDIV ST(0), ST(i) 

FDIV ST(i), ST(O’) 

除了 执行 的 是 除法 而 不 是 加 法 外 ，FDIV 的 操作 与 FADD 相同 。 比 如 ， 无 参数 FDIV 执 
行 ST(1) 除 以 ST(0)。 然 后 ST (0) 弹出 堆栈 ， 将 被 除数 留 在 栈 顶 。 使 用 内 存 操作 数 
的 FDIV 将 ST (0) 除 以 内 存 操作 数 。 下 面 的 代码 将 dblOne 除 以 dblTwo， 并 将 商 保 存 到 
dblQuot: 


.data 

dblone REAL8 1234.56 

dblTwo REAL8 10.0 

dblouot REAL8 ? 

.Code 

fld dblOne ;加 载 到 ST(0) 

fdiv dblTwo ;ST(0) 除 以 dblTwo 

fstp dblQuot ;将 ST(0) 保存 到 dblQuot 


若 源 操作 数 为 0， 则 产生 除 零 异 常 。 若 源 操作 数 等 于 正 、 负 无 穷 ， 零 或 NaN， 则 使 用 一 
些 特殊 情况 。 更 多 细节 ， 请 参阅 Intel 指令 集 参 考 (Intel Instruction Set Reference) 手册 。 

FIDIV FIDIV 指令 先 将 整数 源 操作 数 转换 为 扩展 双 精 度 浮 点 数 ， 再 执行 与 ST (0 ) 的 
除法 。 其 语法 如 下 : 


FIDIV mléint 
FIDIV m32int 


12.2.6 ”比较 浮 点 数值 


浮 点 数 不 能 使 用 CMP 指令 进行 比较 ， 因 为 后 者 是 通过 整数 减法 来 执行 比较 的 。 取 而 代 
之 ， 必 须 使 用 FCOM 指令 。 执 行 FCOM 指令 后 ， 还 需要 采取 特殊 步骤 ， 然 后 再 使 用 逻辑 IF 
语句 中 的 条 件 跳 转 指令 (JA、JB、 正 等 )。 由 于 所 有 的 浮 点 数 都 为 隐 含 的 有 符号 数 ， 因 此 ， 
FCOM 执行 的 是 有 符号 比较 。 

FCOM、FCOMP、FCOMPP ”FCOM (比较 浮 点 数 ) 
指令 将 其 源 操作 数 与 ST (0) 进行 比较 。 源 操作 数 可 以 为 
内 存 操作 数 或 FPU 寄存 器 。 其 语法 如 右 : 

FCOMP 指令 的 操作 数 类 型 和 执行 的 操作 与 FCOM 指 
令 相 同 , 但 是 它 要 将 ST (0 ) 弹出 堆栈 。FCOMPP 指令 与 











比较 ST (0) 与 ST (1) 
FCOM m32fp | 比较 ST(0) 与 m32fp 
FCOM m64fp | 比较 ST(0) 与 m64fp 
FCOM ST(i) | 比较 ST(0) 与 ST (i) 
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FCOMP 相同 ,但 是 它 有 两 次 出 栈 操作 。 
条 件 码 FPU 条 件 码 标识 有 3 个 ，C3、C2 和 C0， 用 以 说 明 浮 点 数 比 较 的 结果 ( 表 12- 
13 )。 由 于 C3、C2 和 C0 的 功能 分 别 与 零 标志 位 (ZF)、 奇 偶 标志 位 (PF) 和 进位 标志 位 (CF) 
相同 ， 因 此 表 中 列 标题 给 出 了 与 之 等 价 的 CPU 状态 标识 。 
表 12-13 FCOM、FCOMP 和 FCOMPP 设置 的 条 件 码 


C3 ( 零 标志 位 ) | C2 (奇偶 标志 位 ) | C0 (进位 标志 位 ) 使 用 的 条 件 跳 转 指令 


ST (0) >SPC 
ST (0) <SPC 
ST (0) =SPC 





@ 如 果 出 现 无 效 算术 运算 操作 数 异 常 (无效 操作 数 )， 且 该 异常 被 屏蔽 ， 则 C3、C2 和 C0 按照 标记 为 “无 序 ” 
的 行 来 设置 。 


在 比较 了 两 个 数值 并 设置 了 FPU 条 件 码 之 后 ， 遇 到 的 主要 挑战 就 是 怎样 根据 条 件 分 支 
到 相应 标号 。 这 包括 了 两 个 步骤 : 

e 用 FNSTSW 指令 把 FPU 状态 字 送 入 AX。 

e 用 SAHF 指令 把 AH 复制 到 EFLAGS 寄存 器 。 

条 件 码 送 入 EFLAGS 之 后 ， 就 可 以 根据 ZF、PF 和 CF 进行 条 件 跳 转 。 表 12-13 列 出 了 
每 种 标志 位 组 合 所 对 应 的 条 件 跳 转 。 根 据 该 表 还 可 以 推出 其 他 跳 转 : 如 果 CF=0， 则 可 以 使 
用 JAE 指令 引发 控制 转移 ， 如 果 CF=1 或 ZE=1， 则 可 使 用 JBE 指令 引发 控制 转移 ; 如 果 
ZF=0， 则 可 使 用 JNE 指令 。 

示例 ” 现 有 如 下 C++ 代码 段 : 


double X= 1.2; 
double Y = 3.0; 
int N= 


与 之 等 效 的 汇编 语言 代码 如 下 : 


.data 
X REAL8 1.2 
Y REAL8 3.0 


N DWORD 0 

.Code 

人 
N=1 
18 x ; ST(0) = X 
fcomp Y ; 比较 ST(0) 和 Y 
fnstsw ax 7 状态 字 送 入 AX 
sahf ;RH 复制 到 EFLAGS 
jnb L1 ;X 不 小 于 Y? 跳 过 
mov N,1 人 


Bs 


P6 处 理 器 的 改进 ”对 上 面 的 例子 需要 说 明 一 点 的 是 浮 点 数 比 较 的 运行 时 开销 大 于 整数 
比较 。 考 虑 到 这 一 点 ，Intel P6 系列 引入 了 FCOMI 指令 。 该 指令 比较 浮 点 数值 ， 并 直接 设 
置 ZF、PF 和 CF。(P6 系列 以 Pentium Pro 和 Pentium 工 处 理 器 为 起 点 。) FCOMI 的 语法 如 下 : 
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FCOMI ST(0),ST(i) 


现在 用 FCOMI 重 写 前 面 的 示例 代码 (比较 XX 和 六): 


.Code 

El 

? N = 一 1 
EL ; ST(0) = Y 
fld xX 7 ST(0) = X; SC) = YY 
fcomi SsT(0),SsT(1) ?7 比较 ST(0) 和 sT (1) 
jn” “a ;ST (0) 不 小 于 ST (1) ? 跳 过 
mov N,1 ;N=1 

Ll1: 


FCOMI 指令 代替 了 之 前 代码 段 中 的 三 条 指令 ， 但 是 增加 了 一 条 FLD 指令 。FCOMI 指 
令 不 使 用 内 存 操作 数 - 

相等 比较 ， 

几乎 所 有 的 编程 人 门 教材 都 会 警告 读者 不 要 进行 浮 点 数 相等 的 比较 ， 其 原因 是 在 计算 
过 程 中 出 现 的 舍 人 人 误差。 现在 通过 计算 表达 
式 (sqrt (2.0) *sqrt (2.0)) -2.0 来 对 这 个 表 12-14 计算 (sqrt ( 2.0 ) *sqrt (2.0)) -2.0 
问题 进行 说 明 。 从 数学 上 看 ， 这 个 表达 式 应 
该 等 于 0， 但 计算 结果 却 相差 甚 远 ( 约 等 于 
4.4408921E-016 )。 使 用 如 下 数据 ， 表 12-14 
列 出 了 每 一 步 计算 后 FPU 堆栈 的 情况 : 


vall REAL8 2.0 


比较 两 个 浮 点 数 x 和 yy 的 正确 方法 是 取 它 们 差 值 的 绝对 值 |x-y|， 再 将 其 与 用 户 定义 的 
误差 值 epsilon 进行 比较 。 汇 编 语言 代码 如 下 ， 其 中 ，epsilon 为 两 数 差 值 允许 的 最 大 值 ， 不 
大 于 该 值 则 认为 这 两 个 浮 点 数 相等 : 

人 REAL8 1.0E-12 


val2 REAL8 0.0 ; 比较 的 数值 
val3 REAL8 1.001E-13 ; 认为 等 于 val2 












fld vall : +2.0000000E+000 


: +1.4142135E+000 
: +2.0000000E+000 
: +4.4408921E-016 









fmul ST(0), ST(0) 
fsub vall 


Code 

; 如 果 ( val2 == val3 )， 显示 “Values are equal". 
fld epsilon 
fld val2 
fsub val3 


fcomi ST(0),ST(1) 
ja skip 
mWrite <"Values are equal" ,0dh,0ah> 
Skip: 
表 12-15 跟踪 程序 执行 过 程 ， 显 示 了 前 四 条 指令 执行 后 的 堆栈 情况 。 
表 12-15 计算 点 积 ( 6.0*2.0 ) + ( 4.5*3.2 ) 


[aa | | 
fabs ST(0) : +1.0010000E-013 























fld epsilon ST(1): +1.0000000E-012 






fsub val3 
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如 果 将 val3 重新 定义 为 大 于 epsilon， 它 就 不 会 等 于 val2 : 


Val3 RERL8 1.001E-12 ;不 相等 


12.2.7 ” 读 写 浮 点 数值 


本 书 链接 库 有 两 个 浮 点 数 输入 输出 过 程 ， 它 们 由 圣何塞 州立 大 学 ( San Jose State 
University) 的 威廉 姆 . 巴 雷 特 (William Barrett) 编写 : 

e@ ReadFloat: 从 键盘 读 取 一 个 浮 点 数 ， 并 将 其 压 人 浮 点 堆栈 。 

e WriteFloat: 将 ST (0) 中 的 浮 点 数 以 阶 码 形式 写 到 控制 台 窗口 。 

ReadFloat 接收 各 种 形式 的 浮 点 数 ， 示 例如 下 : 


ShowFPUStack ” 另 一 个 有 用 的 过 程 ， 由 太平 洋 路 德 大 学 ( Pacific Lutheran University ) 
的 詹姆斯 . 布 林 克 (James Brink) 编写 ， 能 够 显示 FPU 堆栈 。 调 用 该 过 程 不 需要 参数 : 


533 call ShowFPUStack 


示例 程序 下 面 的 示例 程序 把 两 个 浮 点 数 压 和 人 FPU 堆栈 并 显示 ， 再 由 用 户 输入 两 个 数 ， 
将 它们 相 乘 并 显示 乘积 : 


;32 位 浮 点 数 I/O 测试 (floatTest32.asm) 


INCLUDE Irvine32.inc 
INCLUDE macros.inc 


-data 

first REAL8 123.456 
second REAL8 10.0 
third REAL8 ? 


.code 
main PROC 

finit 7 初始 化 FPU 
7 两 个 浮 点 数 入 栈 ， 并 显示 FPU 堆栈 。 

fld first 


fid second 
call ShowFPUStack 
; 输入 两 个 浮 点 数 并 显示 它们 的 乘积 。 
mWrite "Please enter a real number: ” 
call ReadFloat 


mWrite "Please enter a real number: " 
call ReadFloat 
fmul ST(0),ST(1) ; 相 乘 


mWrite "Their product is: ” 
call WriteFloat 
call Cr1lf 
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exit 
main ENDP 
END main 


示例 输入 /输出 (用户 输入 显示 为 粗 体 ) 如 下 : 


FPU Stack 
ST(0): +1.0000000E+001 
ST(1): +1.2345600E+002 
Please enter a real number: 3.5 


Please enter a real number: 4.2 





Their product is: +1.4700000E+001 


12.2.8 ”异常 同步 


整数 (CPU) 和 FPU 是 相互 独立 的 单元 ， 因 此 ， 在 执行 整数 和 系统 指令 的 同时 可 以 执行 
浮 点 指令 。 这 个 功能 被 称 为 并 行 性 ( concurrency)， 当 发 生 未 屏蔽 的 浮 点 异常 时 ， 它 可 能 是 
个 潜在 的 问题 。 反 之 , 已 屏蔽 异常 则 不 成 问题 ， 因 为 ，FPU 总 是 可 以 完成 当前 操作 并 保存 
结果 。 

发 生 未 屏蔽 异常 时 ， 中 断 当 前 的 浮 点 指令 ，FPU 发 异常 事件 信号 。 当 下 一 条 浮 点 指令 或 
FWAIT ( WAIT) 指令 将 要 执行 时 ，FPU 检查 待 处 理 的 异常 。 如 果 发 现 有 这 样 的 异常 ，FPU 
就 调用 浮 点 异常 处 理 程序 ( 子 程序 )。 

如 果 引 发 异常 的 浮 点 指令 后 面 跟 的 是 整数 或 系统 指令 ， 情 况 又 会 是 怎样 的 呢 ? 很 遗憾 ， 指 
令 不 会 检查 待 处 理 异常 一 一 它们 会 立即 执行 。 假 设 第 一 条 指令 将 其 输出 送 入 一 个 内 存 操作 数 ， 
而 第 二 条 指令 又 要 修改 同一 个 内 存 操作 数 ， 那 么 异常 处 理 程序 就 不 能 正确 执行 。 示 例如 下 : 


.data 

intVal DWORD 25 

Code 

fild intVal ; 将 整数 加 载 到 ST (0) 
inc intVal ;整数 加 1 


设置 WAIT 和 FWAIT 指令 是 为 了 在 执行 下 一 条 指令 之 前 ， 强 制 处 理 器 检查 待 处 理 且 未 
屏蔽 的 浮 点 异常 。 这 两 条 指令 中 的 任 一 条 都 可 以 解决 这 种 潜在 的 同步 问题 ， 直 到 异常 处 理 程 
序 结束 ， 才 执行 INC 指令 。 

fild intVal ; 将 整数 加 载 到 ST (0) 


fwait ;等待 待 处 理 异 党 
inc intVal ; 整数 加 1 


12.2.9 代码 示例 


本 节 将 用 几 个 简短 的 例子 来 演示 浮 点 算术 运算 指令 。 一 个 很 好 的 学 习 方 法 是 用 C++ 编 
写 表达 式 ， 编 译 后 ， 再 检查 由 编译 器 生成 的 代码 。 

1. 表达 式 

现在 编写 代码 ， 计 算 表 达 式 valD=-valA+ (valB*valC)。 下 面 给 出 一 种 可 能 的 循序 渐进 的 方 
法 : 将 valA 加 载 到 堆栈 ， 并 取 其 负数 ; 将 valB 加 载 到 ST (0),， 则 valA 成 为 ST (1); 将 ST (0) 
和 valC 相 乘 ， 乘 积 保存 在 ST (0) 中 ; 将 ST (1) 与 ST (0) 相 加 ， 和 数 保存 到 valD: 
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-Gata 

ValA RERAL8 1.5 
valB REAL8 2.5 
valC REAL8 3.0 
valD REAL8 ?; +6.0 


.Code 
fld vala ; ST(0) = vala 
fchs ; 修改 ST (0) 的 符号 
fld valB ; 将 valB 加 载 到 ST (0) 
533 fmul valC ; ST(0) *= valc 
fadd ; ST(0) += ST(1) 
fstp valD ; 将 ST(0) 保存 到 valD 
2. 数组 求 和 


下 面 的 代码 计算 并 显示 一 个 双 精 度 实数 数组 之 和 : 


ARRAY SIZE = 20 


.data 
sngArray REAL8 ARRAY SIZE DUP(?) 
-Code 
mov esi,0 ; 数组 索引 
fldz ; 0.0 入 栈 


mov eCx,ARRAY SI2ZE 
L1: fld sngArray[esi] ;将 内 存 操 作 数 加 载 到 ST(0) 


fadd ;? ST(0) 加 ST(1) ， 出 栈 
add ”esi,TYPE REAL8 ; 移 到 下 一 个 元 素 
loop Ll1 
call WriteFloat 7 显示 ST (0) 中 的 和 数 
3. 平方 根 之 和 
FSQRT 指令 对 ST (0 ) 中 的 数值 求 平方 根 ， 并 将 结果 送 回 ST (0 )。 下 面 的 代码 计算 了 
两 个 数 的 平方 根 之 和 : 
-data 


ValA REAL8 25.0 
valB REAL8 36.0 


.Code 

fld valR ; valA 入 栈 

fsqrt ;ST(0) = sqrt(valAa) 
fld valB ; ValB 入 栈 

fsqrt ;ST(0) = sqrt(valB) 
fadd ; ST (0)+ST (1) 

4. 数组 点 积 


下 面 的 代码 计算 了 表达 式 (array[0]*array[1]) + (array[2]*array[3])。 该 计算 有 时 也 被 称 
为 点 积 (dot product)。 表 12-16 列 出 了 每 条 指令 执行 后 ，FPU 堆栈 的 情况 。 输 入 数据 如 下 : 


:data 
array REAL4 6.0,; 2.0, 4.5, 3.2 


表 12-16 计算 点 积 ( 6.0*2.0 ) + ( 4.5*3.2 ) 


FPU 堆栈 
ST(0): +6.0000000E+000 frnul [array+12] ST(0): +1.4400000E+001 
fmul [array+4] ST(0): +1.2000000Et00l | | srD:+l2000000E+00l 


fld [array+8] ST(0): +4.5000000E+000 fadd ST(0): +2.6400000E+001 
536 ST(D: +1.2000000E+001 | | 
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12.2.10 ”混合 模式 运算 


都 目前 为 止 , 算术 运算 只 涉及 实数 。 应 用 程序 通常 执行 的 是 包含 了 整数 与 实数 的 混合 模 
式 运 算 。 整 数 运算 指令 ， 如 ADD 和 MUL， 不 能 操作 实数 ， 因 此 只 能 选择 用 浮 点 指令 。Intel 
指令 集 提供 指令 将 整数 转换 为 实数 ， 并 将 数值 加 载 到 浮 点 堆栈 。 


示例 下 面 的 C++ 代码 将 一 个 整数 与 一 个 双 精 度数 相 加 ， 并 把 和 数 保 存 为 双 精 度数 。 
C++ 在 执行 加 法 前 ， 把 整数 自动 转换 为 实数 : 


int N = 20; 
double X = 


:data 

N SDWORD 20 

X REAL8 3.5 

Z REAL8 3? 

.Code 

fild N “整数 加 载 到 ST (0) 

fadd x 7 将 内 存 操 作 数 与 ST (0) 相 加 
fstp 2 ;将 ST(0) 保存 到 内 存 操 作 数 


示例 下 面 的 C++ 程序 把 N 转换 为 双 精 度数 后 ， 计 算 一 个 实数 表达 式 ， 再 将 结果 保存 
为 整数 变量 : 


int N = 20; 
double X = 3.5; 
int 2 = (int) (NB + XX); 


Visual C++ 生成 的 代码 先 调用 转换 函数 ( ftol)， 再 把 截断 的 结果 保存 到 Z。 如 果 在 表达 
式 的 汇编 代码 中 使 用 FIST， 那 么 就 可 以 避免 函数 调用 ， 不 过 Z (默认 ) 会 向 上 舍 入 为 24: 


fild N ;整数 加 载 到 ST (0) 
fadd Xx ，; 将 内 存 操作 数 与 ST(0) 相 加 
fist 2 ;将 ST(0) 保存 为 整 型 内 存 操作 数 


修改 舍 入 模式 ”FPU 控制 字 的 RC 字段 指定 使 用 的 舍 入 类 型 。 可 以 先 用 FSTCW 把 控制 
字 保 存 为 一 个 变量 ， 再 修改 RC 字段 (位 10 和 11 )， 最 后 用 FLDCW 指令 把 这 个 变量 加 载 回 
控制 字 : 


fstcw ctrlWword ; 保存 控制 字 
or ctrlWword,110000000000b ; 设置 RC= 截断 
fldcw ctrlword ; 加 载 控制 字 


之 后 采用 截断 执行 计算 ， 生 成 结果 为 Z=23: 


fild N ; 整数 加 载 到 ST (0) 
fadd Xx ;将 内 存 整 数 与 ST(0) 相 加 
fist 2 ;将 ST(0) 保存 为 整 型 内 存 操 作 数 


或 者 ， 把 舍 人 模式 重新 设置 为 默认 选项 ( 舍 入 到 最 接近 的 偶数 ): 


fstcw ctrlword ; 保存 控制 字 
and ctrlWord,001111111111b ; 重 置 含 入 模式 为 默认 
fldcw ctrlword ; 加载 控制 字 
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12.2.11 屏蔽 与 未 屏蔽 异常 


默认 情况 下 ， 异 常 是 被 屏蔽 的 (12.2.3 节 )， 因 此 ， 当 出 现 浮 点 异常 时 ， 处 理 器 分 配 一 
个 默认 值 为 结果 ， 并 继续 平稳 地 工作 。 例 如 ， 一 个 浮 点 数 除 以 0 生成 结果 为 无 穷 ， 但 不 会 中 
断 程序 : 


-data 

vall DWORD 1 

val2 REAL8 0.0 

.Code 

fild vall  ; 整数 加 载 到 ST(0) 
fdiv val2 ;ST(0)= 正 无 穷 


如 果 FPU 控制 字 没 有 屏蔽 异常 ， 那 么 处 理 器 就 会 试 着 执行 合适 的 异常 处 理 程序 。 清 除 
FPU 控制 字 中 的 相应 位 就 可 以 实现 异常 的 未 屏蔽 操作 ( 表 12-17 )。 假 设 不 想 屏蔽 除 零 异 常 ， 
则 需要 如 下 步骤 : 

1 ) 将 FPU 控制 字 保 存 到 16 位 变量 。 

2 ) 清除 位 2〈 除 零 标志 位 )。 

3 ) 将 变量 加 载 回 控制 字 。 


表 12-17 FPU 控制 字 字 段 























本 
无 效 操作 异常 屏蔽 位 于 精度 异常 屏蔽 位 
非 规格 化 操作 数 异 常 屏蔽 位 精度 控制 位 






除 堆 异 常 屏蔽 位 
上 滋 异 常 屏蔽 位 
下 滋 异 常 屏蔽 位 | 


下 面 的 代码 实现 了 浮 点 异常 的 未 屏蔽 操作 : 


舍 人 控制 位 
无 穷 控 制 位 


.data 
ctrlWord WORD ? 
.Code 


fstcw ctrlWord ; 获取 控制 字 
and ctrlWword,1111111111111011b ;不 屏蔽 除 零 异 常 
fldcw ctrlword ; 结果 加 载 回 FPU 
现在 ， 如 果 执 行 除 零 代码 ， 那 么 就 会 产生 一 个 未 屏蔽 异常 : 
fild vall 
fdiv val2 7 除 零 
fst val2 
只 要 FST 指令 开始 执行 ，MS-Windows 就 会 显示 如 下 对 话 框 : 
[erem rm secswatm 
@ i Ain dsm, | 
9 on TE to rp te prop am 1 
世 gu et dp | 
ES | 


屏蔽 异常 要 屏 项 一 个 异常 ， 就 把 FPU 控制 字 中 的 相应 应 位 置 1。 下 面 的 代码 屏蔽 了 除 零 
异常 : 
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-data 
ctrlWword WORD ? 
:code 


fstcw ctrlWord ; 获取 控制 字 

or ctrlWord,100b ; 屏蔽 除 零 异常 

fldcw ctrlword 7 结果 加 载 回 FPU 
12.2.12 ”本 节 回 顾 


1. 编写 一 条 指令 ,将 ST (0 ) 的 副本 加 载 到 FPU 堆栈 。 

2. 如 果 ST (0 ) 定位 于 寄存 器 堆栈 中 的 寄存 器 R6， 那 么 ST (2 ) 的 位 置 在 哪里 ? 
3. 请 说 出 最 少 3 个 FPU 专用 寄存 器 。 

4. 若 浮 点 指令 的 第 二 个 字母 为 B， 那 么 操作 数 是 什么 类 型 ? 

5. 哪 种 浮 点 指令 使 用 立即 操作 数 ? 


12.3 x86 指令 编码 


若 要 完全 理解 汇编 语言 操作 码 和 操作 数 ， 就 需要 花 些 时 间 了 解 汇编 指令 翻译 成 机 器 语言 
的 方法 。 由 于 Intel 指令 集 使 用 了 丰富 多 样 的 指令 和 寻 址 模式 ， 因 此 这 个 问题 相当 复杂 。 首 
先 以 实地 址 模式 的 8086/8088 为 例 来 说 明 ， 之 后 ， 再 展示 32 位 处 理 器 带 来 的 变化 。 

Intel 8086 处 理 器 是 第 一 个 使 用 复杂 指令 集 计 算 机 (Complex Instruction Set Computer， 
CISC) 设计 的 处 理 器 。 这 种 指令 集中 包含 了 各 种 各 样 的 内 存 寻 址 、 移 位 、 算 术 运 算 、 数 据 传 
送 和 人 逻辑 操作 。 与 RISC (精简 指令 集 计 算 机 ，Reduced Instruction Set Computer) 指令 相 比 ， 
Intel 指令 在 编码 和 解码 方面 有 些 复杂 。 指 令 编 码 (encode) 是 指 将 汇编 语言 指令 及 其 操作 数 
转换 为 机 器 码 。 指 令 解码 (decode) 是 指 将 机 器 指令 转换 为 汇编 语言 。 对 Intel 指令 编码 和 解 
码 的 逐步 解释 至 少将 有 助 于 唤起 对 MASM 作者 们 辛苦 工作 的 理解 和 欣赏 。 


12.3.1 指令 格式 


一 般 的 x86 机 器 指令 格式 (图 12-6 ) 包含 了 一 个 指令 前 缀 字 节 、 操 作 码 、Mod R/M 字 
节 、 伸 缩 索引 字 节 ( SIB)、 地 址 位 移 和 立即 数 。 指 令 按 小 端 顺 序 存 放 ， 因 此 前 缀 字 节 位 于 指 
令 的 起 始 地 址 。 每 条 指令 都 有 一 个 操作 码 ， 而 其 他 字段 则 是 可 选 的 。 少 数 指令 包含 了 全 部 字 
段 ， 平 均 来 看 ， 绝 大 多 数 指令 都 有 2 个 或 3 个 字 节 。 下 面 是 对 指令 字段 的 简介 : 


| 指令 前 级 操作 码 | ModRM | 。 SIB 。 | 地 址 位 移 | 立即 数 | 


1 字 节 1 一 3 字 节 1 字 节 1 字 节 1 一 4 字 节 1 一 4 字 节 


| Mod | 寄存 器 /操作 码 | RM | 


位 6 一 7 ”位 3 一 5 位 0~2 位 6 一 7 位 3~5 位 0 一 2 
图 12-6 x86 指令 格式 


。 指令 前 缀 覆盖 默认 操作 数 大 小 。 

。 操作 码 (操作 代码 ) 指定 指令 的 特定 变 体 。 比 如 ， 按 照 使 用 的 参数 类 型 ,指令 ADD 
有 9 种 不 同 的 操作 码 。 

。 Mod R/M 字段 指定 寻 址 模式 和 操作 数 。 符 号 “ R/M ”代表 的 是 寄存 器 和 模式 。 表 
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12-18 列 出 了 Mod 字段 ， 表 12-19 给 出 了 当 Mod=10b 时 16 位 应 用 程序 的 R/M 字段 。 

e 伸缩 索引 字 节 (scale index byte，SIB) 用 于 计算 数组 索引 偏 移 量 。 

。 地 址 位 移 字段 保存 了 操作 数 的 偏 移 量 ， 在 基 址 - 偏 移 量 或 基 址 - 变 址 - 偏 移 量 寻 址 
模式 中 ， 该 字段 还 可 以 与 基 址 或 变 址 寄存 器 相 加 。 

。 立即 数字 段 保 存 了 常量 操作 数 。 


表 12-18 Mod 字段 取 值 


Mod 位 移 
00 DISP=0， 位 移 低 半 部 分 和 高 半 部 分 都 无 定义 (除非 rm=110 ) 
01 DISP= 位 移 低 半 部 分 符号 扩展 到 16 位 ， 位 移 高 半 部 分 无 定义 
10 DISP= 位 移 高 半 部 分 和 低 半 部 分 都 有 效 
11 R/M 字段 包含 的 是 寄存 器 编号 


表 12-19 16 位 R/M 字段 取 值 (Mod=10 ) 


ET | 


人 
[BX+DI}+D16 NON [DIJ+D16 
[BP+SD+D16 IE EHDG 
[BP+DI}+D16 [en [BXJ+D16 


@@D16 表示 偏 移 量 是 16 位 的 。 


12.3.2 ”单字 节 指令 


没有 操作 数 或 只 有 一 个 隐 含 操作 数 的 指令 是 最 简单 的 指令 。 这 种 指令 只 需要 操作 码 字 
段 ， 字 段 值 由 处 理 器 的 指令 集 预 先 确定 。 表 12-20 列 出 了 表 忆 20 前 字 节 措 各 
几 个 常见 的 单字 节 指 令 。 在 这 些 指令 中 ，INC DX 指令 好 像 
是 不 应 该 出 现 的 ， 它 出 现 的 原因 是 : 指令 集 的 设计 者 决定 
为 某 些 常用 指令 提供 独特 的 操作 码 。 其 结果 是 ， 为 了 代码 
量 和 执行 速度 要 对 寄存 器 增 量 操作 进行 优化 。 | 98 | mcpx| 


12.3.3 ”立即 数 送 寄存 器 


立即 操作 数 (常数 ) 按照 小 端 顺 序 (起 始 地 址 为 最 低 字 
节 ) 添加 到 指令 。 首 先 关注 的 是 立即 数 送 寄存 器 指令 ， 暂 
不 考虑 内 存 寻 址 的 复杂 性 。 将 一 个 立即 字 送 寄存 器 的 MOV 
指令 的 编码 格式 为 : B8+rw dw， 其 中 操作 码 字 节 的 值 为 
B8+rw， 表 示 将 一 个 寄存 器 编号 (0 一 7) 与 B8 相 加 ; dw 
为 立即 字 操 作 数 ， 低 字 节 在 低地 址 。( 表 12-21 列 出 了 操作 

码 使 用 的 寄存 器 编号 。) 下 面 例子 中 出 现 的 所 有 数值 都 为 十 六 进 制 。 

示例 : PUSH CX 机 器 指令 为 S1。 编 码 步骤 如 下 : 

1 ) 带 一 个 16 位 寄存 器 操作 数 的 PUSH 指令 编码 为 50。 

2 ) CX 的 寄存 器 编码 为 1， 因 此 1+50 得 到 操作 码 为 51。 

示例 : MOV AX，1 机 器 指令 为 B8 01 00 (十 六 进 制 ) 。 编 码 过 程 如 下 : 

1 ) 立即 数 送 16 位 寄存 器 的 操作 码 为 B8。 
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2 ) AX 的 寄存 器 编号 为 0, 将 0 加 上 B8 (参见 表 12-21 ) 。 

3 ) 立即 操作 数 (0001 ) 按 小 端 顺序 添加 到 指令 (01，00 )。 

示例 : MOV BX，1234h 机 器 指令 为 BB 34 12。 编 码 过 程 如 下 : 

1 ) 立即 数 送 16 位 寄存 器 的 操作 码 为 B8。 

2 ) BX 的 寄存 器 编号 为 3， 将 3 加 上 B8g 得 到 操作 码 BB。 

3 ) 立即 操作 数字 节 为 34 12。 

从 实践 的 角度 出 发 ， 建 议 手 动 汇编 一 些 MOV 立即 数 指令 来 提高 能 力 ， 然 后 通过 MASM 
的 源 列表 文件 中 的 生成 代码 来 检查 汇编 结果 。 


12.3.4 ”寄存 器 模式 指令 


在 使 用 寄存 器 操作 数 的 指令 中 ，Mod R/ 表 12-22 Mod R/M 字段 标识 寄存 器 
M 字 节 用 一 个 3 位 的 标识 符 来 表示 寄存 器 操 
作 数 。 表 12-22 列 出 了 寄存 器 的 位 编码 。 操 作 
码 字 段 的 位 0 用 于 选择 8 位 或 16 位 寄存 器 : 
1 表示 16 位 寄存 器 ，0 表示 8 位 寄存 器 。 

比如 ，Mov ax，Bx 的 机 器 码 为 89 D8。 寄 
存 器 送 其 他 操作 数 的 16 位 MOV 指令 的 Intel 编码 为 89/r， 其 中 /rt 表 示 操 作 码 后 面 带 一 个 
Mod R/M 字 节 。Mod R/M 字 节 有 三 个 字段 (mod、reg 和 r/m)。 例 如 ， 若 Mod R/M 的 值 为 
D8， 则 它 包含 如 下 字段 : 


e 位 6~7 是 mod 字 段 ， 指 定 寻 址 模式 。mod 字段 为 11 表示 rm 字段 包含 的 是 一 个 寄 
存 器 编号 。 

e 位 3 一 5 是 reg 字段， 指定 源 操作 数 。 在 本 例 中 ，BX 就 是 编号 为 011 的 寄存 器 。 

ee 位 0 一 2 是 rm 字段 ， 指 定 目的 操作 数 。 本 例 中 ，AX 是 编号 为 000 的 寄存 器 。 

表 12-23 列 出 了 更 多 使 用 8 位 和 16 位 寄存 器 操作 数 的 例子 。 


表 12-23 MOV 指令 编码 和 寄存 器 操作 数 的 示例 


mov cx, dx 


mov cl, dl 


12.3.5 ”处 理 器 操作 数 大 小 前 绥 


现在 将 注意 力 转 回 到 x86 处 理 器 ( IA-32 ) 的 指令 编码 。 有 些 指令 以 操作 数 大 小 前 缀 开 
始 ， 覆 盖 了 其 修改 指令 的 默认 段 属性 。 问 题 是 ， 为 什么 有 指令 前 级 ? 在 编写 8088/8086 指令 
集 时 ， 几 乎 所 有 256 个 可 能 的 操作 码 都 用 于 处 理 带 有 8 位 和 16 位 操作 数 的 指令 。 当 Intel 开 
发 32 位 处 理 器 时 ， 就 需要 想 办 法 发 明 新 的 操作 码 来 处 理 32 位 操作 数 ， 而 同时 还 要 保持 与 之 
前 处 理 器 的 兼容 性 。 对 于 面向 16 位 处 理 器 的 程序 ， 所 有 使 用 32 位 操作 数 的 指令 都 添加 一 个 
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前 级 字 节 。 对 于 面向 32 位 处 理 器 的 程序 ， 默 认为 32 位 操作 数 ， 因 此 所 有 使 用 16 位 操作 数 
的 指令 添加 一 个 前 缀 字 节 。8 位 操作 数 不 需 要 前 级 。 

示例 : 16 位 操作 数 ” 现 在 对 表 12-23 中 的 MOV 指令 进行 汇编 ， 以 此 为 例 来 看 看 在 16 
位 模式 下 前 缀 字 节 是 如 何 起 作用 的 。.286 伪 指 令 指 明 编 译 代码 的 目标 处 理 器 ， 确 保 不 使 用 
32 位 寄存 器 。 下 面 的 每 条 MOV 指令 都 给 出 了 其 指令 编码 : 


.model small 
.286 


.Stack 100h 

Code 

main PROC 
mov ax,dx + SB. C2 
mov al,dl ; BA C2 


现在 对 32 位 处 理 器 汇编 相同 的 指令 ,使 用 .386 伪 指 令 ， 默 认 操 作 数 为 32 位 。 指 令 将 
包括 16 位 和 32 位 操作 数 。 第 一 条 MOYV 指令 (EAX、EDX) 使 用 的 是 32 位 操作 数 ， 因 此 不 
需要 前 级 。 第 二 条 MOV ( AX、DX) 指令 由 于 使 用 的 是 16 位 操作 数 ， 因 此 需要 操作 数 大 小 
前 缀 (66 ): 


.model small 
.386 

.Stack 100h 
.Code 

main PROC 


mov eax,edx ; 8B C2 
mov ax,dx ; 66 8B C2 
mov al,dl ; 8A C2 


12.3.6 ”内 存 模式 指令 


如 果 Mod R/M 字 节 只 用 于 标识 寄存 器 操作 数 ， 那 么 Intel 指令 编码 就 会 相对 简单 。 实 际 
上 ，Intel 汇编 语言 有 着 各 种 各 样 的 内 存 寻 址 模式 ， 这 就 使 得 Mod R/M 字 节 编码 相当 复杂 。 
(指令 集 的 复杂 性 是 RISC 设计 支持 者 常见 的 批评 理由 。) 

Mod R/M 字 节 正好 可 以 指定 256 个 不 同 组 合 的 操作 数 。 表 12-24 列 出 了 Mod 00 时 的 
Mod R/M 字 节 (十 六 进 制 )。( 完 整 的 表格 参见 《 Intel 64 and IA-32 Architectures Software 
Developer's Manual 》， 卷 2A。) Mod R/M 字 节 编码 的 作用 如 下 : Mod 列 中 的 两 位 指定 寻 址 
模式 的 集合 。 比 如 ，Mod 00 有 8 种 可 能 的 R/M 数值 (000b ~ 111b)， 有 效 地 址 列 给 出 了 这 
些 数 值 标识 的 操作 数 类 型 。 

假设 想 要 编码 Mov ax，[sI]，Mod 位 为 00b，R/M 位 为 100b。 从 表 12-19 可 知 AX 的 寄 
存 器 编号 为 000b ， 因 此 完整 的 Mod R/M 字 节 为 00 000 100b 或 04h: 


十 六 进 制 字 节 04 在 表 12-24 的 AX 列 第 5 行 。 

MOV [SI]，AL 的 Mod R/M 字 节 还 是 一 样 的 (04h)， 因 为 寄存 器 AL 的 编号 也 是 000。 
现在 对 指令 Mov [sI], aL 进行 编码 。8 位 寄存 器 的 传送 操作 码 为 88。Mod R/M 字 节 为 04h， 
则 机 器 码 为 88 04。 
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MOYV 指令 示例 
表 12-25 列 出 了 8 位 和 16 位 MOYV 指令 所 有 的 指令 格式 和 操作 码 。 表 12-26 和 表 12-27 
给 出 了 表 12-25 中 缩写 符号 的 补充 信息 。 手 动 汇编 MOV 指令 时 可 以 用 这 些 表 作为 参考 。( 更 
多 细节 请 参阅 Intel 手册 。) 


表 12-24 Mod R/M 字 节 的 部 分 列表 ( 16 位 段 ) 
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表 12-25 MOV 指令 操作 码 
RE 而 


字 节 寄存 器 送 EA 字 节 操作 数 
EA 字 操 作 数 送 字 寄存 器 
SS 送 EA 字 操 作 数 













ET 

8E/3 内 存 字 送 DS 

字条 存 名 DS 

字 节 变量 ( 偏 移 量 为 dw) 送 AL 
字 变 量 ( 偏 移 量 为 tw) 送 AX 
AL 送 字 节 变量 ( 偏 移 量 为 dw) 


AX 送 字 寄 存 器 ( 偏 移 量 为 dw) 














字 寄存 器 送 ES 
内 存 字 送 SS 






BO+rb db 字 节 立 即 数 送 字 节 寄存 器 
MOV rw dw | 字 立 即 数 送 字 寄 存 器 

字 节 立即 数 送 EA 字 节 操作 数 
字 立 即 数 送 EA 字 操 作 数 


表 12-26 ”指令 操作 码 关键 字 
操作 码 后 面 跟 一 个 Mod R/M 字 节 ， 该 字 节 后 面 可 能 再 跟 立 即 数 和 偏 移 量 字 段 - 数字 mn (0 一 7) 为 Mod R/ 


M 字 节 中 reg 字段 的 值 


操作 码 后 面 跟 一 个 Mod R/M 字 节 ， 该 字 节 后 面 可 能 再 跟 立 即 数 和 偏 移 量 字 段 
操作 码 和 Mod R/M 字 节 后 面 跟 一 个 字 节 立即 操作 数 

操作 码 和 Mod R/M 字 节 后 面 跟 一 个 字 立 即 操作 数 

8 位 寄存 器 的 编号 ( 0 ~ 7 )， 与 前 面 的 十 六 进 制 字 节 一 起 构成 8 位 操作 码 

16 位 寄存 器 的 编号 (0 一 7 )， 与 前 面 的 十 六 进 制 字 节 一 起 构成 8 位 操作 码 


表 12-27 ”指令 操作 数 关 键 字 
-128 ~ +127 之 间 的 有 符号 数 。 若 操作 数 为 字 类 型 ， 则 该 数值 进行 符号 扩展 


指令 操作 数 为 字 类 型 的 立即 数 


字 节 类 型 操作 数 ， 可 以 是 寄存 器 也 可 以 是 内 存 操作 数 
字 类 型 操作 数 ， 可 以 是 寄存 器 也 可 以 是 内 存 操作 数 
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用 数值 (0 ~ 7 ) 标识 的 8 位 寄存 器 
用 数值 (0 ~ 7 ) 标识 的 16 位 寄存 器 





无 基 址 或 变 址 寄存 器 的 简单 字 节 内 存 变量 
无 基 址 或 变 址 寄存 器 的 简单 字 内 存 变 量 





表 12-28 列 出 了 更 多 的 MOV 指令 ， 这 些 指 令 能 手动 汇编 ， 且 可 以 与 表 中 的 机 器 代码 比 
546| ” 较 。 假设 myWord 的 起 始 地 址 偏 移 量 为 0102h。 


表 12-28 ”MOYV 指令 与 机 器 码 示例 


指令 寻 址 模式 
mov ax, my Word 直接 (为 AX 优化 ) 
Re 
mov[dil,bx 变 址 
es CT 
mov[bxtsiliax 基 址 - 变 址 
mov word prt [bx+di+2], 1234h 基 址 -- 变 址 - 偏 移 量 
12.3.7 本 节 回 顾 
1. 写 出 下 列 MOYV 指令 的 操作 码 : 


.data 

myByte BYTE ? 

myWord WORD ? 

Code 

mov ax,@data 

mov ds,ax ; 
mov ax,bx ; 
mov bl,al ? 
mov al,[si] ? 
mov myByte,al ? 
mov myWord,ax ? 


mm onNnUvoy 


2. 写 出 下 列 MOV 指令 的 Mod R/M 字 节 : 


.data 

array WORD 5 DUP(?) 
.Code 

mov axredata 

mov ds,ax 

mov dl,bl 

mov bl,[di] 

mov ax,[si+2] 

mov axrarray[sil] 
mov array[di],ax 


m0OALNUTvm 


12.4 ”本 章 小 结 


二 进 制 浮 点 数 由 三 部 分 组 成 : 符号 、 有 效 数字 和 阶 码 。Intel 处 理 器 使 用 了 三 种 浮 点 数 二 
进 制 存储 格式 ， 这 些 格式 都 出 自由 IEEE 组 织 制 定 的 标准 754-1985: 二 进 制 浮 点 数 运算 : 
e 32 位 单 精度 数值 包含 1 位 符号 、8 位 阶 码 ， 以 及 23 位 有 效 数字 的 小 数 部 分 。 
e 64 位 双 精 度数 值 包含 1 位 符号 、11 位 阶 码 ， 以 及 52 位 有 效 数字 的 小 数 部 分 。 
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e 80 位 扩展 双 精 度数 值 包含 1 位 符号 、16 位 阶 码 ， 以 及 63 位 有 效 数 字 的 小 数 部 分 。 

若 符号 位 为 1， 则 数值 为 负数 ; 若 该 位 为 0， 则 数值 为 正 数 。 

浮 点 数 的 有 效 数 字 由 小 数 点 左右 两 边 的 十 进 制 数字 构成 。 

并 非 所 有 处 于 0 到 1 之 间 的 实数 都 可 以 在 计算 机 内 表示 为 浮 点 数 ， 其 原因 是 有 效 位 的 个 
数 是 有 限 的 。 

规格 化 有 限 数 是 指 ， 能 够 编码 为 0 到 无 穷 之 间 的 规格 化 实数 的 所 有 非 零 有 限 数值 。 正 无 
穷 (+ %) 代表 最 大 正 实数 ， 负 无 穷 (- om ) 代表 最 大 负 实 数 。NaN 为 位 模式 ， 不 表示 有 效 
浮 点 数 。 

Intel 8086 处 理 器 被 设计 为 只 处 理 整数 运算 ， 因 此 Intel 提供 了 独立 的 8087 浮 点 数 协 处 
理 器 (floating-point coprocessor) 芯片 与 8086 一 起 置 于 计算 机 的 主板 上 。 随 着 Intel 486 的 
出 现 ， 浮 点 操作 被 整合 到 主 CPU 内 ， 称 为 浮 点 单元 (FPU)。 

FPU 有 8 个 相互 独立 的 可 寻 址 的 80 位 寄存 器 ， 分 别 命名 为 R0 一 R7， 它 们 构成 一 个 寄 
存 器 堆栈 。 在 计算 时 ， 浮 点 操作 数 以 扩展 实数 的 形式 保存 在 FPU 堆栈 中 。 内 存 操作 数 也 可 
以 用 于 计算 。FPU 在 把 算术 运算 操作 的 结果 保存 到 内 存 时 ， 会 把 结果 转换 为 下 述 格式 之 一 : 
整数 、 长 整数 、 单 精度 数 、 双 精度 数 或 者 BCD 码 。 

Intel 浮 点 指令 助 记 符 用 字母 F 开始 ， 以 区 别 于 CPU 指令 。 指 令 的 第 二 个 字母 (通常 为 
B 或 1) 表示 如 何 解释 内 存 操 作 数 : B 表示 为 操作 数 为 二 进 制 编码 的 十 进 制 数 (BCD 码 ), I 
表示 操作 数 为 二 进 制 整数 。 如 果 没 有 指定 ， 那 么 内 存 操 作 数 就 假设 为 实数 格式 。 

Intel 8086 是 第 一 个 使 用 复杂 指令 集 计 算 机 (CISC) 设计 的 处 理 器 。 其 庞大 的 指令 集 包 
含 了 各 种 各 样 的 内 存 寻 址 、 移 位 、 算 术 运 算 、 数 据 传 送 和 逻辑 操作 。 

指令 编码 是 指 把 汇编 语言 指令 及 其 操作 数 转 换 为 机 器 码 。 指 令 解 码 是 指 将 机 器 码 指令 转 
换 为 汇编 语言 指令 及 操作 数 。 

x86 机 器 指令 格式 包含 一 个 可 选 的 前 缀 字 节 、 一 个 操作 码 字 段 、 一 个 可 选 的 Mod R/M 
字 节 、 若 干 可 选 的 立即 数字 节 ， 以 及 若干 可 选 的 内 存 偏 移 量 字 节 。 具 备 全 部 这 些 字段 的 指令 
很 少 。 前 缀 字 节 覆盖 了 目标 处 理 器 默认 的 操作 数 大 小 。 操 作 码 字段 是 指令 独一无二 的 操作 编 
码 。Mod R/M 字段 指定 了 寻 址 模式 和 操作 数 。 在 使 用 寄存 器 操作 数 的 指令 中 ，Mod R/M 字 
节 用 一 个 3 位 标识 符 来 表示 每 个 寄存 器 操作 数 。 


12.5 关键 术语 


address displacement (地 址 位 移 ) 

binary-coded decimal(BCD) (二 进 制 编码 的 十 进 
制 数 ) 

binary long divisiom (二 进 制 长 除法 ) 

Complex Instruction Set Computer(CISC) (复杂 
指令 集 计 算 机 ) 

control register (控制 寄存 器 ) 

concurrency (并 行 ) 

decode an instruction (指令 解码 ) 

denormalize ( 非 规 格 化 ) 

double extended precision (扩展 双 精 度 ) 

double precision( 双 精度 ) 


encode an instruction (指令 编码 ) 

exponent( 阶 码 ) 

expression stack (表达 式 堆栈 ) 

extended real (扩展 实数 ) 

floating-point exception( 浮 点 数 异常 ) 

FPU control word (FPU 控制 字 ) 

immediate data (立即 数 ) 

indefinite number (不 定数 ) 

infix expression (中 缀 表达 式 ) 

last data pointer register (最 后 数据 指针 寄存 器 ) 
last instruction pointer register (最 后 指令 指针 寄 


存 器 ) 
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long real (长 实数 ) Reduced Instruction Set(RISC) (精简 指令 集 ) 
mantissa (尾数 ) register stack (寄存 器 堆栈 ) 

masked exception (屏蔽 异常 ) rounding ( 舍 人 ) 

Mod R/M byte (Mod R/M 字 节 ) Scale Index Byte(SIB) (伸缩 索引 字 节 ) 
Nan(Not a Number) (NaN)( 非 数值 ) short real ( 短 实数 ) 

negative infinity ( 负 无 穷 ) sign (符号 ) 

normalized finite number (规格 化 有 限 数 ) signaling NaN ( 信 令 NaN) 

normalized from (规格 化 形式 ) significand (有 效 数字 ) 

opcode register (操作 码 寄 存 器 ) single precision( 单 精度 ) 

positive infinity( 正 无 穷 ) status register (状态 寄存 器 ) 

postfix expression (后 级 表达 式 ) tag register (标识 寄存 器 ) 

prefix byte (前 缀 字 节 ) temporary real (临时 实数 ) 

quiet NaN (沉寂 NaN) unmasked exception( 非 屏蔽 异常 ) 


RC field (RC 字段 ) 


12.6 复习 题 和 练习 


12.6.1 简 答题 


1. 假设 有 二 进 制 浮 点 数 1101.01101， 如 何 将 其 表示 为 十 进 制 分 数 之 和 ? 

2. 为 什么 十 进 制 数 0.2 不 能 用 有 限 位 数 精确 表示 ? 

3. 假设 有 二 进 制 数 11011.01011， 则 其 规格 化 数值 为 多 少 ? 

4. 假设 有 二 进 制 数 0000100111101.1， 则 其 规格 化 数值 为 多 少 ? 

5. NaN 有 了 哪 两 种 类 型 ? 

6. FLD 指令 允许 的 最 大 数据 类 型 是 什么 ， 它 包含 了 多 少 位 ? 
549| ”7.FSTP 指令 与 FST 指令 有 哪些 不 同 ? 

8. 哪 条 指令 能 修改 浮 点 数 的 符号 ? 

9. FADD 指令 允许 使 用 哪些 类 型 的 操作 数 ? 

10. FISUB 指令 与 FSUB 指令 有 哪些 不 同 ? 

11. P6 系列 之 前 的 处 理 器 中 ， 哪 条 指令 可 以 比较 两 个 浮 点 数 ? 

12. 哪 条 指令 实现 将 整数 操作 数 加 载 到 ST (0) ? 

13. FPU 控制 字 中 的 哪个 字段 可 以 修改 处 理 器 的 伟人 模式 ? 


12.6.2 ”算法 基础 


1. 请 写 出 二 进 制 数 +1110.011 的 IEEE 单 精 度 编码 。 

2. 将 分 数 5/8 转换 为 二 进 制 实数 。 

3. 将 分 数 17/32 转换 为 二 进 制 实数 。 

4. 将 十 进 制 数 +10.75 转换 为 IEEE 单 精 度 实数 。 

5. 将 十 进 制 数 -76.0625 转换 为 IEEE 单 精度 实数 。 

6. 编写 含有 两 条 指令 的 序列 ， 将 FPU 状态 标志 送 入 EFLAGS 寄存 器 。 

7. 现 有 一 个 精确 结果 1.010101101， 使 用 FPU 默认 舍 人 模式 将 该 值 舍 入 为 8 位 有 效 数字 。 
8. 现 有 一 个 精确 结果 -1.010101101， 使 用 FPU 默认 舍 人 模式 将 该 值 舍 人 为 8 位 有 效 数字 。 
9. 编写 指令 序列 实现 如 下 C++ 代码 : 
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double 
double 
double 
double 


~ wu 二 


“8 
本 
1 


寺 呈 县 了 


-M* (N+ B); 


10. 编写 指令 序列 实现 如 下 C++ 代码 : 


int B = 7; 
double N = 7.1; 
double P = sqrt(N) + B; 


11. 给 出 如 下 MOYV 指令 的 操作 码 : 


.data 

myByte BYTE ? 
myWord WORD ? 
“Code 

mov ax,@data 
mov ds,ax 

mov es,ax 

mov dl,bl 

mov bl,[dil] 
mov ax,[si+2] 
mov al,myByte 
mov dx,myWord 


ho Dan ritp 
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12. 给 出 如 下 MOV 指令 的 Mod R/M 字 节 : 


.data 

array WORD 5 DUP(?) 
.Code 

mov ax,&@data 

mov ds,ax 

mov BYTE PTR array,5 
mov dx,[bp+5] 

mov [dil],bx 

mov [di+2],dx 

mov array[si+2],ax 
mov array[bx+di],ax 


we ~ ve Ne ve ~ 


moOAoNnTUp 


13. 手动 汇编 如 下 指令 ， 并 写 出 每 条 有 标记 指令 的 十 六 进 制 机 器 码 字 节 序列 。 假 设 vall 起 始 地 址 的 偏 
移 量 为 0。 使 用 16 位 数值 时 ， 字 节 序 列 必 须 按 小 端 顺序 呈现 : 


data 

vall BYTE 5 
val2 WORD 256 
.Code 

mov ax,&data 
mov ds,ax 
mov al,vall 
mov Ccx,val2 
mov dx,OFFSET vall 
mov dl,2 

mov bx,1000h 


we Ne ee ~ 


mpanornpn 


12.7 ”编程 练习 


*1. 比较 浮 点 数 
编写 汇编 语言 程序 段 实现 如 下 C++ 代码 。 用 WriteString 函数 调用 代替 printf() 函数 调用 : 
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2 


3 


4 


5 


广 直 1 


double X; 
double Y; 
if( KR) 
printf("X is lower\n"); 
else 
printf("xX is not lower\n"); 


(使 用 Irvine32 链接 库 例 程 进行 控制 台 输出 ， 不 要 调用 标准 C 链接 库 的 printf 函数 。) 多 次 运行 
编写 的 程序 ， 指 定 X 和 YY 的 取 值 范围 ， 以 测试 该 程序 的 逻辑 。 


. 显示 二 进 制 浮 点 数 


编写 过 程 ， 接 收 一 个 单 精度 浮 点 二 进 制 数 ， 并 按 如 下 格式 显示 : 符号 : 显示 为 + 或 -; 有 效 数 
字 : 二 进 制 浮 点 数 ， 前 缀 为 “1.”; 阶 码 : 显示 为 十 进 制 ， 无 偏差 ， 以 字母 E 和 阶 码 符号 开始 。 示 
例如 下 : 


.data 
sample REAL4 -1.75 


显示 输出 : 
-1.11000000000000000000000 E+0 


设置 舍 入 模式 
(需要 宏 知 识 。) 编写 宏 设 置 FPU 舍 人 人 模式。 唯一 的 输入 参数 是 两 个 字母 的 编码 : 
e RE: 舍 人 到 最 近 的 偶数 
e RD: 向 负 无 穷 舍 人 
e RU: 向 正 无 穷 舍 人 
e RZ: 向 零 舍 人 (截断 ) 
示例 宏 调用 (不 考虑 大 小 写 ): 


mRound Re 
mRound rd 
mRound RU 
mRound rzZ 


编写 一 个 简单 的 测试 程序 ， 使 用 FIST (保存 整数 ) 指令 检测 每 种 可 能 的 伟人 模式 。 


. 计算 表达 式 


编写 程序 计算 如 下 算术 表达 式 : 
((A+B)/C)*((D-A) +E) 
为 变量 分 配 测试 数据 ， 并 显示 运算 结果 。 
圆 的 面积 
编写 程序 ， 提 示 用 户 输 入 圆 的 半径 。 计 算 并 显示 圆 的 面积 。 要 求 使 用 本 书 链接 库 的 ReadFloat 
和 WriteFloat 过 程 ， 并 用 FLDPI 指令 将 ze 加载 寄存 器 堆栈 。 


. 二 次 方程 式 


现 有 和 多项式 ax*+ bx + c = 0， 提 示 用 户 输入 系数 a, b，c。 利 用 该 式 计算 并 显示 多 项 式 的 实 根 。 
若 出 现 虚 根 ， 则 显示 相应 信息 。 
显示 寄存 器 状态 数值 

标识 寄存 器 ( 12.2.1 节 ) 表示 的 是 FPU 寄存 器 内 容 的 类 型 ， 每 个 寄存 器 对 应 两 位 (图 12-7 )。 
调用 FSTENYV 指令 加 载 标 识字 ,该 指令 填充 如 下 保护 模式 结构 (Irvine32.inc 中 有 定义 ): 


FPU ENVIRON STRUCT 
controlWord WORD ? 
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ALIGN DWORD 


statusWord WORD ? 

ALIGN DWORD 

tagWord WORD ? 

ALIGN DWORD 

instrPointeroffset DWORD ? 


instrPpointerSelector DWORD ? 
operandPointerOffset DWORD ? 
operandPointerSelector WORD ? 


WORD ? ; 未 使 用 
FPU_ENVIRON ENDS 

编写 程序 将 两 个 或 两 个 以 上 数值 压 入 FPU 堆栈 ， 调 用 ShowFPUStack 显示 堆栈 ， 显 示 每 个 
FPU 数据 寄存 器 的 标识 值 ， 显 示 ST (0 ) 对 应 的 寄存 器 编号 。( 对 后 者 ， 调 用 FSTSW 指令 将 状态 字 
保存 到 16 位 整数 变量 ， 并 提取 位 11 ~ 13 的 堆栈 TOP 指针 。) 以 如 下 输出 示例 为 参考 


FPU Stack 
: +1.5000000E+000 
: +2.0000000E+000 

empty 

empty 

empty 

empty 

empty 

empty 

valid 


valid 


ST(0) = R6 





从 输出 示例 可 以 看 出 来 ，ST (0 ) 为 R6， 因 此 ST (1 ) 就 为 R7。 这 两 个 寄存 器 都 包含 了 一 个 
有 效 浮 点 数 。 


15 0 

[Rz| Rs | Rs | R4 | Ra [rz | Rl| go | 

TAG 值 

00= 有 效 

01= 零 

10= 特殊 (NaN、 不 支持 的 、 无 穷 ， 或 非 规格 化 ) 
11= 空 


图 12-7 标识 字数 值 
本 章 尾 注 


1《 Intel 64 and IA-32 Architectures Software Developer's Manual 》， 卷 1， 第 4 章 。 还 可 参见 http : //grouper.ieee. 
org/groups/754/。 

2.《 Intel 64 and IA-32 Architectures Software Developer’s Manual 》, 卷 1, 第 4 章 。 

3. 来 自 德 保罗 大 学 (DePaul University) 的 哈 维 ' 奈 斯 (Harvey Nice)。 

4. MASM 使 用 无 参数 FADD 指令 执行 与 Intel 无 参数 FADDP 指令 相同 的 操作 。 

5. MASM 使 用 无 参数 FSUB 指令 执行 与 Intel 无 参数 FSUBP 指令 相同 的 操作 。 

6. MASM 使 用 无 参数 FMUL 指令 执行 与 Intel 无 参数 FMULP 指令 相同 的 操作 。 

7. MASM 使 用 无 参数 FDIV 指令 执行 与 Intel 无 参数 FDIVP 指令 相同 的 操作 。 
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高 级 语言 接口 


13.1 引言 


大 多 数 程序 员 不 会 用 汇编 语言 编写 大 型 程序 ， 因 为 这 将 花费 相当 多 的 时 间 。 反 之 ， 高 级 
语言 则 隐藏 了 会 减缓 项 目 开发 进度 的 细节 。 但 是 汇编 语言 仍然 广泛 用 于 配置 硬件 驱动 器 ， 以 
及 优化 程序 速度 和 代码 量 。 

本 章 将 重点 关注 汇编 语言 和 高 级 编程 语言 之 间 的 接口 或 连接 。 第 二 节 将 展示 如 何在 C++ 
中 编写 内 联 汇 编 代 码 。 第 三 节 将 把 32 位 汇编 语言 模块 链接 到 C++ 程序 。 最 后 ， 将 说 明 如 何 
在 汇编 程序 中 调用 C 库 函 数 。 


13.1.1 通用 规范 


从 高 级 语言 中 调用 汇编 过 程 时 ， 需 要 解决 一 些 常见 的 问题 。 

首先 ， 一 种 语言 使 用 的 命名 规范 ( naming convention) 是 指 与 变量 和 过 程 命名 相关 的 规 
则 和 特性 。 比 如 ， 一 个 需要 回答 的 重要 问题 是 : 汇编 器 或 编译 器 会 修改 目标 文件 中 的 标识 符 
名 称 吗 ?如 果 是 ， 如 何 修改 ? 

其 次 ， 段 名 称 必须 与 高 级 语言 使 用 的 名 称 兼 容 。 

第 三 ， 程 序 使 用 的 内 存 模式 ( 微 模式 、 小 描述 、 紧 凑 模 式 、 中 模式 、 大 模式 、 巨 模式 ， 
或 平坦 模式 ) 决定 了 段 大 小 (16 或 32 位 )， 以 及 调用 或 引用 是 近 (同一 段 内 ) 还 是 远 (不 同 
段 之 间 )。 

调用 规范 ”调用 规范 (calling convention) 是 指 调用 过 程 的 底层 细节 。 下 面 列 出 了 需要 
考虑 的 细节 信息 : 

e 调用 过 程 需要 保存 哪些 寄存 器 

e 传递 参数 的 方法 : 用 寄存 器 、 用 堆栈 、 共 享 内 存 ， 或 者 其 他 方法 

e 主 调 程序 调用 过 程 时 ， 参 数 传递 的 顺序 

@ 参数 传递 方法 是 传 值 还 是 传 引用 

e 过 程 调用 后 ， 如 何 恢复 堆栈 指针 

e 函数 如 何 向 主 调 程序 返回 结果 

命名 规范 与 外 部 标识 符 ” 当 从 其 他 语言 程序 中 调用 汇编 过 程 时 ， 外 部 标识 符 必须 与 命名 
规范 (命名 规则 ) 兼容 。 外 部 标识 符 ( external identifier) 是 放 在 模块 目标 文件 中 的 名 称 ， 链 
接 器 使 得 这 些 名 称 能 够 被 其 他 程序 模块 使 用 。 链 接 器 解析 对 外 部 标识 符 的 引用 ,但 是 仅 适用 
于 命名 规范 一 致 的 情况 。 

例如 ， 假设 C 程序 Main.c 调用 外 部 过 程 ArraySum。 如 下 图 所 示 ，C 编译 器 自动 保留 大 
小 写 ， 并 为 外 部 名 称 添 加 前 导 下 划 线 ， 将 其 修改 为 _ArraySum : 
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调用 : 输出 : 


ArraySum ARRAYSUM 
[main.c| i 链接 器 Array.asm.model flat, Pascal 


Array.asm 模块 用 汇编 语言 编写 ， 由 于 其 .MODEL 伪 指令 使 用 的 选项 为 Pascal 语言 ， 因 
此 输出 ArraySum 过 程 的 名 称 就 是 ARRAYSUM。 由 于 两 个 输出 的 名 称 不 同 ， 因 此 链接 器 无 
法 生成 可 执行 程序 。 

早期 编程 语言 ， 如 COBOL 和 PASCAL， 其 编译 器 一 般 将 标识 符 全 部 转换 为 大 写字 母 。 
近期 的 语言 ， 如 C、C++ 和 Java 则 保留 了 标识 符 的 大 小 写 。 此 外 ， 支 持 函 数 重 载 的 语言 (如 
C++) 还 使 用 名 称 修饰 (name decoration) 的 技术 为 函数 名 添加 更 多 字符 。 比 如 ， 若 函数 名 
为 MySub (intn，doubleb)， 则 其 输出 可 能 为 MySub#int#double。 

在 汇编 语言 模块 中 ， 通 过 .MODEL 伪 指令 选择 语言 说 明 符 来 控制 大 小 写 。 

段 名 称 汇编 语言 过 程 与 高 级 语言 程序 链接 时 ， 段 名 称 必须 是 兼容 的 。 本 章 使 用 
Microsoft 简化 段 伪 指令 .CODE 、.STACK 和 .DATA ， 它 们 与 Microsoft C++ 编译 器 生成 的 段 
名 称 兼 容 。 

内 存 模式 主 调 程序 与 被 调 过 程 使 用 的 内 存 模式 必须 相同 。 比 如 ， 实 地 址 模式 下 可 选择 
小 模式 、 中 模式 、 紧 凑 模 式 、 大 模式 和 巨 模式 。 保 护 模 式 下 必须 使 用 平坦 模式 。 本 章 将 会 给 
出 两 种 模式 的 例子 。 


13.1.2 ” .MODEL 伪 指 令 


16 位 和 32 位 模式 中 ，MASM 使 用 .MODEL 伪 指 令 确 定 若干 重要 的 程序 特性 ， 内 存 模 
式 类 型 、 过 程 命名 模式 以 及 参数 传递 规则 。 若 汇编 代码 被 其 他 编程 语言 程序 调用 ， 那 么 后 两 
者 就 尤其 重要 。.MODEL 伪 指 令 的 语法 如 下 : 


MODEL memorymodel [,modeloptions] 


MemoryModel 表 13-1 列 出 了 memorymodel 字段 可 选择 的 模式 。 除 了 平坦 模式 之 外 ， 
其 他 所 有 模式 都 可 以 用 于 16 位 实地 址 编程 。 


表 13-1 内存 模式 
模式 说 明 
微 模式 一 个 既 包 含 代码 又 包含 数据 的 段 。 文 件 扩 展 名 为 .com 的 程序 使 用 该 模式 
小 模式 一 个 代码 段 和 一 个 数据 段 。 默 认 情况 下 ， 所 有 代码 和 数据 都 为 近 属 性 


中 模式 多 个 代码 段 ， 一 个 数据 段 

紧凑 模式 | ”一 个 代码 段 ， 多 个 数据 段 

大 模式 多 个 代码 段 和 数据 段 

巨 模式 与 大 模式 相同 ， 但 是 各 个 数据 项 可 以 大 于 单个 段 

平坦 模式 | ”保护 模式 。 代 码 与 数据 使 用 32 位 偏 移 量 。 所 有 的 数据 和 代码 (包括 系统 资源 ) 都 在 一 个 32 位 段 内 


32 位 程序 使 用 平坦 内 存 模式 ， 其 偏 移 量 为 32 位， 代码 和 数据 最 大 可 达 4GB。 比 如 ， 
Irvine32.inc 文件 包含 了 如 下 .MODEL 伪 指 令 : 


.model flat,SsTDCALL 


ModelOptions .MODEL 伪 指令 中 的 ModelOptions 字 段 可 以 包含 一 个 语言 说 明 
符 和 一 个 栈 距离 。 语 言说 明 符 指 定 过 程 与 公共 符号 的 调用 和 命名 规范 。 栈 距离 可 以 是 


556 


[55 
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NEARSTACK (默认 值 ) 或 者 FARSTACK。 

1. 语言 说 明 符 

伪 指 令 .MODEL 有 几 种 不 同 的 可 选 语言 说 明 符 ， 其 中 的 一 些 很 少 使 用 (比如 BASIC、 
FORTRAN 和 PASCAL)。 反 之 , C 和 STDCALL 则 十 分 常见 。 结 合 平坦 内 存 模式 ， 示 例如 下 : 


.model flat, C 
model flat, STDCALL 


语言 说 明 符 STDCALL 用 于 Windows 系统 函数 调用 。 本 章 在 链接 汇编 代码 和 C 与 C++ 
程序 时 ,使 用 C 语言 说 明 符 。 
2. STDCALL 


STDCALL 语言 说 明 符 将 子 程序 参数 按 逆序 (从 后 往 前 ) 压 和 堆栈。 为 了 便于 说 明 ， 首 
先 用 高 级 语言 编写 如 下 函数 调用 : 


AddTwo( 5, 6 ); 


若 STDCALL 被 选 为 语言 说 明 符 ， 则 等 效 的 汇编 语言 代码 如 下 : 
push 6 

push 5 

call AddTwo 


另 一 个 重要 的 考虑 是 ， 过 程 调用 后 如 何 从 堆栈 中 移 除 参数 。STDCALL 要 求 在 RET 指 
令 中 带 一 个 常量 操作 数 。 返 回 地 址 从 堆栈 中 弹出 后 ， 该 常数 为 RET 执行 与 ESP 相 加 的 数值 : 


AddTwo PROC 
push ebp 
mov ebp,esp 
mov eax,[ebp + 12] ; 第 二 个 参数 
add eax,[ebp + 8] ;第 一 个 参数 
pop ebp 
ret 8 ; 清除 堆栈 


AddTwo ENDPP 
堆栈 指针 加 上 8 后 ， 就 指 回 了 主 调 程序 参数 人 栈 之 前 指针 的 位 置 。 
最 后 ，STDCALL 通过 将 输出 (公共) 过 程 名 保存 为 如 下 格式 来 修改 这 些 名称 : 


_name@nn 


前 导 下 划 线 添加 到 过 程 名 ，@ 符号 后 面 的 整数 指定 了 过 程 参数 的 字 节 数 (向 上 舍 入 到 4 


的 倍数 )。 例 如 ,假设 过 程 AddTwo 带 有 两 个 双 字 参数 ， 那 么 汇编 器 传递 给 链接 器 的 名 称 就 
为 _AddTwo@8。 


Microsoft 链接 器 是 区 分 大 小 写 的 ， 因 此 MYSUB@8 和 _MySub@8 是 两 个 不 同 的 
名 称 。 要 查看 OBJ 文 件 中 所 有 的 过 程 名 ， 使 用 Visual Studio 中 的 DUMPBIN 工具 ， 选 


项 为 /SYMBOLS。 





3. C 说 明 符 

和 STDCALL 一 样 ，C 语言 说 明 符 也 要 求 将 过 程 参数 按 从 后 往 前 的 顺序 压 人 堆栈 。 对 于 
过 程 调用 后 从 堆栈 中 移 除 参数 的 问题 ，C 语言 说 明 符 将 这 个 责任 留 给 了 主 调 方 。 在 主 调 程序 
中 ，ESP 与 一 个 常数 相 加 ， 将 其 再 次 设置 为 参数 入 栈 之 前 的 位 置 : 
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push 6 ; 第 二 个 参数 
Push 5 ; 第 一 个 参数 
call AddTwo 


add esp,8 ”; 清除 堆栈 
C 语言 说 明 符 在 外 部 过 程 名 的 前 面 添 加 前 导 下 划 线 。 示 例如 下 : 


_AddTwo 


13.1.3 ”检查 编译 器 生成 的 代码 


长 久 以 来 ，C 和 C++ 编译 器 都 会 生成 汇编 语言 源 代  ” 表 13-2 生成 汇编 代码 的 Visual 
码 ， 但 是 程序 员 通 常 看 不 到 。 这 是 因为 ， 汇 编 语 言 代 码 C++ 命令 行 选 项 
只 是 产生 可 执行 文件 过 程 的 一 个 中 间 步 又 。 幸 运 的 是 ， 列表 文件 内 容 
大 多 数 编译 器 都 可 以 应 要 求生 成 汇编 语言 源 代 码 文件 。 /FA 仅 汇编 文件 
例如 ， 表 13-2 列 出 了 Visual Studio 控制 汇编 源 代码 输出 汇编 文件 与 机 器 码 
的 命令 行 选项 。 汇编 文件 与 源 代码 

检查 编译 器 生成 的 代码 文件 有 助 于 理解 底层 信息 ， 和 
比如 堆栈 帧 结构 、 循 环 和 逻辑 编码 ， 并 且 还 有 可 能 找到 低级 编程 错误 。 另 一 个 好 处 是 更 加 便 
于 发 现 不 同 编译 器 生成 代码 的 差异 。 

现在 来 看 看 C++ 编译 器 生成 优化 代码 的 一 种 方法 。 由 于 是 第 一 个 例子 ， 因 此 先 编写 一 
个 简单 的 C 方法 ArraySum， 并 在 Visual Studio 2012 中 进行 编译 ， 其 设置 如 下 : 

e Optimization=Disabled( 使 用 调试 器 时 需要 ) 


® Favor Size or Speed=Favor fast code 














© Assembler Output=Assembly With Source Code 
下 面 是 用 ANSI C 编写 的 arraysum 源 代码 : 


int arraySum( int array[], int count ) 
{ 
mE 注 六 
int sum = 0; 
for(li = 0; i < count; i++) 
sum += array[il]; 
return sum; 


} 
现在 来 查看 由 编译 器 生成 的 arraysum 的 汇编 代码 ， 如 图 13-1 所 示 。 


sum$ = -8 
i$ = -4 
array$ = 8 
count$ = 12 
arraySum PROC 





图 13-1 Visual Studio 生成 的 ArraySum 汇编 代码 
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jmp 
SLN28arraySum: 
mov 
add 
mov 
$LN3@arraySum: 
mov 


jmp 
SLNl@arraySum: 


10 
区 


49: 
50s 12 
$18 


52: pop 
533 pop 
54: pop 
55: mov 
56: pop 
575 ret 
58: _arraySum ENDP 


esi 
edi 


int i; 
int sum = 0; 


DWORD PTR sum$[ebp], 0 


for(i = 07 i < count; it+) 


DWORD PTR iS$[ebp], 0 
SHORT S$SLN38@arraySum 


eax, DWORD PTR is$[ebp] 
eax, 1 
DWORD PTR iS$[ebp], eax 


eax, DWORD PTR _i$[ebp] 
eax, DWORD PTR count$ [ebp] 
SHORT S$LNl@arraySum 


sum += array[i]; 


eax, DWORD PTR i$[ebp] 
ecx, DWORD PTR array$[ebp] 
edx, DWORD PTR _sum$ [ebp] 
edx, DWORD PTR [ecx+eax*4] 
DWORD PTR sum$[ebp], edx 
SHORT SLN2@arraySum 


return sum; 


eax, DWORD PTR _sum$ [ebp] 


esp, ebp 
ebp 
0 





图 13-1 ( 续 ) 
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1 一 4 行 定义 了 两 个 局 部 变量 (sum 和 i) 的 负数 偏 移 量 ， 以 及 输入 参数 array 和 count 


的 正 数 偏 移 量 : 
1: sum$ = -8 ? 
2: _is = -4 


3: _array$ = 8 7 
4: _CountS = 12 ? 


9 一 10 行 设置 ESP 为 帧 指针 : 


9， push ebp 
10: mov ebp,esp 


外 
这 
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14 行 从 ESP 中 减 去 72， 为 局 部 变量 预 留 堆 栈 空间 。 同 时 ， 把 将 会 被 函数 


修改 的 三 个 寄存 器 保存 到 堆栈 。 


srs 本 一 
生计 sub 
12: push 
13s push 
14: Push 


esp,72 
ebx 
esi 
edi 


19 行 把 局 部 变量 sum 定位 到 堆栈 帧 ， 并 将 其 初始 化 为 0。 由 于 符号 _sumg 定义 为 数 
值 -8， 因 此 它 就 位 于 当前 EBP 下 面 8 个 字 节 的 位 置 ; 


19 1: mov DWORD PTR _sum$[ebp],0 


24 和 25 行将 变量 i 初始 化 为 0， 再 转移 到 30 行 ， 跳 过 后 面 循环 计数 器 递增 的 语句 : 


24: mov 
25.s jmp 


DWORD PTR is$[ebp], 0 
SHORT $LN3@arraySum 


26 ~ 29 行 标记 循环 开端 以 及 循环 计数 器 递增 的 位 置 。 从 C 源 代码 来 看 ， 递 增 操作 
(i++) 是 在 循环 末尾 执行 ,但 是 编译 器 却 将 这 部 分 代码 移 到 了 循环 顶部 : 


26: $LN2@arraySum: 


27: mov 
28: add 
29s mov 


eax, DWORD PTR i$[ebp] 
eax, 1 
DWORD PTR i$[ebp], eax 


30 一 33 行 比较 变量 i 和 count， 如 果 i 大 于 或 等 于 count， 则 跳出 循环 : 


30: S$LN3@arraySum: 


31: mov 
323 cmp 
33s jge 


eax, DWORD PTR _i$[ebp] 
eax, DWORD PTR count$[ebp] 
SHORT S$LNl@arraySum 


37 ~ 41 行 计算 表达 式 sum+=array[i]。Array[i 复制 到 ECX，sum 复制 到 EDX， 执 行 加 


法 运算 后 ，EDX 的 内 容 再 复制 回 sum: 
37: mov eax, DWORD PTR _i$[ebp] 
38: mov ecx, DWORD PTR array$ [ebp] ; array[i] 
39: mov edx, DWORD PTR _sum$[ebp] ; Sum 
40: add edx, DWORD PTR [ecx+eax*4] 
413 mov DWORD PTR sum$[ebp], edx 
4 和 2 行将 控制 转 回 循环 项 部 : 
42: jmp SHORT $LN2@arraySum 


43 行 的 标号 正好 位 于 循环 之 外 ， 该 位 置 便于 作为 循环 结束 时 进行 跳 转 的 目标 地 址 : 


43: $LNl@arraySum: 


48 行将 变量 sum 送信 EAX， 准备 返回 主 调 程序 。52 ~ 56 行 恢复 之 前 被 保存 的 寄存 器 ， 
其 中 ，ESP 必须 指向 主 调 程序 在 堆栈 中 的 返回 地 址 。 


48: mov 
49: 

i 
51 

52 pop 
53 pop 
54 pop 
55 mov 


eax, DWORD PTR _sum$ [ebp] 


} 


edi 
esi 
ebx 
esp, ebp 
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56 : pop ebp 
57: ret 0 
58 : _arraySum ENDP 


可 以 写 出 比 上 例 更 快 的 代码 ， 这 种 想法 不 无 道理 。 上 例 中 的 代码 是 为 了 进行 交互 式 调试 ， 
因此 为 了 可 读 性 而 牺牲 了 速度 。 如 果 针 对 确定 目标 编译 同样 的 程序 ， 并 选择 完全 优化 ， 那 么 
结果 代码 的 执行 速度 将 会 非常 快 ， 但 同时 ， 程 序 对 人 类 而 言 基 本 上 是 无 法 阅读 和 理解 的 。 

调试 器 设置 ”用 Visual Studio 调试 C 和 C++ 程序 时 ， 若 想 查看 汇编 语言 源 代 码 ， 就 在 
Tools 菜单 中 选择 Options 以 显示 如 图 13-2 的 对 话 框 窗口 ， 再 选择 箭头 所 指 的 选项 。 上 述 设 
置 要 在 启动 调试 器 之 前 完成 。 接 着 ， 在 调试 会 话 开 始 后 ， 右 键 点 击 源 代码 窗口 ， 从 弹出 菜单 
中 选择 Go to Disassembly。 
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图 13-2 ”启动 Visual Studio 的 地 址 级 调试 


本 章 目 标 是 熟悉 由 C 和 C++ 编译 器 产生 的 最 直接 和 简单 的 代码 生成 例子 。 此 外 ， 认 识 
到 编译 器 有 多 种 方法 生成 代码 也 是 很 重要 的 。 比 如 ， 它 们 可 以 将 代码 优化 为 尽 可 能 少 的 机 器 
代码 字 节 。 或 者 ， 可 以 尝试 生成 尽 可 能 快 的 代码 ， 即 使 要 用 大 量 机 器 代码 字 节 来 输出 结果 
(常见 的 情况 )。 最 后 ， 编 译 器 还 可 以 在 代码 量 和 速度 的 优化 间 进 行 折 中 。 为 速度 进行 优化 的 
代码 可 能 包含 更 多 指令 ， 其 原因 是 ， 为 了 追求 更 快 的 执行 速度 会 展开 循环 。 机 器 代码 还 可 以 
拆 分 为 两 部 分 以 便利 用 双核 处 理 器 ， 这 些 处 理 器 能 同时 执行 两 条 并 行 代码 。 


13.1.4 本 节 回 顾 


1. 什么 是 编程 语言 使 用 的 命名 规范 ? 
2. 实地 址 模式 可 以 选择 哪些 内 存 模式 ? 
3. 使 用 STDCALL 语言 说 明 符 的 汇编 语言 过 程 可 以 与 C++ 程序 链接 吗 ? 


13.2 ”内 散 汇 编 代 码 


13.2.1 Visual C++ 中 的 _asm 伪 指令 
内 党 汇 编 代 码 (inline assembly code) 是 指 直接 插 人 高 级 语言 程序 中 的 汇编 源 代 码 。 大 
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多 数 C 和 C++ 编译 器 都 支持 这 一 功能 。 

本 节 将 展示 如 何在 运行 于 32 位 保护 模式 ， 并 采用 平坦 内 存 模式 的 Microsoft Visual C++ 
中 编写 内 舱 汇 编 代 码 。 其 他 高 级 语言 编译 器 也 支持 内 舱 汇 编 代 码 ， 但 其 语法 会 发 生变 化 。 

内 垦 汇 编 代 码 是 把 汇编 代码 编写 为 外 部 模块 的 一 种 直接 替换 方式 。 编 写 内 嵌 代 码 最 突出 
的 优点 就 是 简单 性 ， 因 为 不 用 考虑 外 部 链接 ， 命 名 以 及 参数 传递 协议 等 问题 。 

但 使 用 内 藤 汇 编 代 码 最 大 的 缺点 是 缺少 兼容 性 。 高 级 语言 程序 针对 不 同 目 的 平台 进行 纺 
译 时 ， 这 就 成 了 一 个 问题 。 比 如 ， 在 Intel Pentium 处 理 器 上 运行 的 内 肉 汇 编 代 码 就 不 能 在 
RISC 处 理 器 上 运行 。 一 定 程度 上 ， 在 程序 源 代 码 中 插 人 条 件 定义 可 以 解决 这 个 问题 ， 择 人 
的 定义 针对 不 同 目标 系统 可 以 启用 函数 的 不 同 版 本 。 不 过 ， 容 易 看 出 ， 维 护 仍然 是 个 问题 。 
另 一 方面 ， 外 部 汇编 过 程 的 链接 库容 易 被 为 不 同 目标 机 器 设计 的 相似 链接 库 所 代替 。 

_asm 伪 指 令 在 Visual C++ 中 ， 伪 指令 “asm 可 以 放 在 一 条 语句 之 前 ， 也 可 以 放 在 
一 个 汇编 语句 块 〈 称 为 asm 块 ) 之 前 。 语 法 如 下 : 

asm statement 


_asm { 
statement—-1 
statement-2 


batementi 
} 
(在 “asm” 的 前 面 有 两 个 下 划 线 。) 
注释 ”注释 可 以 放 在 asm 块 内 任何 语句 的 后 面 ， 使 用 汇编 语法 或 C/C++ 语法 。Visual 
C++ 手册 建议 不 要 使 用 汇编 风格 的 注释 ， 以 防 与 C 宏 混淆 ， 因 为 C 宏 会 在 单个 逻辑 行 上 进 
行 扩展 。 下 面 是 可 用 注释 的 例子 : 


mov esi,buf ; initialize index register 
mov esi,buf // initialize index register 
mov esi,buf /* initialize index register */ 


特点 ”编写 内 嵌 汇 编 代码 时 允许 : 

@ 使 用 x86 指令 集 内 的 大 多 数 指令 。 

e 使 用 寄存 器 名 作为 操作 数 。 

e 通过 名 字 引 用 函数 参数 。 

e 引用 在 asm 块 之 外 定义 的 代码 标号 和 变量 。( 这 点 很 重要 ， 因 为 局 部 函数 变量 必须 在 
asm 块 的 外 面 定义 。) 

e 使 用 包含 在 汇编 风格 或 C 风格 基数 表示 法 中 的 数字 常数 。 比 如 ，0A26h 和 0xA26 是 
等 价 的 ， 且 都 能 使 用 。 

e 在 语句 中 使 用 PTR 运算 符 ， 比 如 inc BYTE PTR[esi]。 

e 使 用 EVEN 和 ALIGN 伪 指 令 。 

限制 ”编写 内 藤 汇 编 代 码 时 不 允许 : 

。 使 用 数据 定义 伪 指 令 ， 如 DB (BYTE) 和 DW (WORD)。 

e 使 用 汇编 运算 符 (除了 PTR 之 外 )。 

e 使 用 STRUCT、RECORD、WIDTH 和 MASK。 

@ 使 用 宏 伪 指令 ， 包括 MACRO、REPT、 IRC、 IRP 和 ENDM， 以 及 宏 运算 符 (二 、! 、 
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&、% 和 .TYPE)。 

e 通过 名 字 引 用 段 。( 但 是 ， 可 以 用 段 寄 存 器 名 作为 操作 数 。) 

寄存 器 值 不 能 在 一 个 asm 块 开 始 的 时 候 对 寄存 器 值 进行 任何 假设 。 寄 存 器 有 可 能 被 
asm 块 前 面 的 执行 代码 修改 。Microsoft Visual C++ 的 关键 字 ”fastcall 会 使 编译 器 用 寄存 器 
来 传递 参数 ， 为 了 避免 寄存 器 冲突 ， 不 要 同时 使 用 _ fastcall 和 __asm。 

一 般 情况 下 ， 可 以 在 内 艇 代码 中 修改 EAX、EBX、ECX 和 EDX， 因 为 编译 器 并 不 期 望 
在 语句 之 间 保 留 这 些 寄存 器 值 。 但 是 ， 如 果 修 改 的 寄存 器 太 多 ， 那 么 编译 器 就 无 法 对 同一 过 
程 中 的 C++ 代码 进行 完全 优化 ， 因 为 优化 要 用 到 寄存 器 。 

虽然 不 能 使 用 OFFSET 运算 符 ， 但 是 用 LEA 指令 也 可 以 得 到 变量 的 偏 移 地 址 。 比 如 ， 
下 面 的 指令 将 buffer 的 偏 移 地 址 送 入 ESI: 


lea esi,buffer 


长 度 、 类 型 和 大 小 ”内 嵌 汇 编 代 码 还 可 以 使 用 LENGTH、SIZE 和 TYPE 运算 符 。 
LENGTH 运算 符 返回 数组 内 元 素 的 个 数 。 按 照 不 同 的 对 象 ，TYPE 运算 符 返 回 值 如 下 : 

e@ 对 C 或 C++ 类 型 以 及 标量 变量 ， 返 回 其 字 节 数 。 

e 对 结构 ， 返 回 其 字 节 数 。 

e 对 数组 ， 返 回 其 单个 元 素 的 大 小 。 

SIZE 运算 符 返 回 LENGTH*TYPE 的 值 。 下 面 的 程序 片段 演示 了 内 艇 汇编 程序 对 各 种 
C++ 类 型 的 返回 值 。 


Microsoft Visual C++ 内 嵌 汇 编程 序 不 支持 SIZEOF 和 LENGHTOF 运算 符 。 


使 用 LENGTH、TYPE 和 SIZE 运算 符 
下 面 程序 包含 的 内 肉 汇 编 代码 使 用 LENGTH、TYPE 和 SIZE 运算 符 对 C++ 变量 求 值 。 
每 个 表达 式 的 返回 值 都 在 同一 行 的 注释 中 给 出 : 


struct Package { 


long origin2ip; // 4 
long destinationZip; // 4 
float shippingPrice; // 4 


char myChar; 

bool myBool; 

short myShort; 

int myInt; 

long myLong; 

float myFloat; 
double myDouble; 
Package myPackage; 


long double myLongDouble; 
long myLongArray[10]; 
_asm{ 
mov eax,myPackage.destinationzip; 


mov eax,LENGTH myInt; PA 
mov eax,LENGTH myLongArray; et | 
mov eax,TYPE myChar; yy 
mov eax,TYPE myBool; "A 
mov eax,TYPE myShort; 
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mov eax,TYPE myInt; yA 
mov eax,TYPE myLong; // 4 
mov eax,TYPE myFloat; // 4 
mov eax,TYPE myDouble; // 8 
mov eax,TYPE myPackage; A 12 
mov eax,TYPE myLongDouble; Pf 
mov eax,TYPE myLongArray; A 
mov eax,SIZE myLong; // 4 
mov eax,SIZE myPackage; 1/1” 2 
mov eax,SIZE myLongArray; 4 40 


13.2.2 ”文件 加 密 示 例 


现在 查看 的 简短 程序 实现 如 下 操作 : 读 取 一 个 文件 ， 对 其 进行 加 密 ， 再 将 其 输出 到 另 一 
个 文件 。 函 数 TranslateBuffer 用 一 个 _asm 块 定义 语句 ， 在 一 个 字符 数组 内 进行 循环 ， 并 把 
每 个 字符 与 预定 义 值 进行 XOR 运算 。 内 艇 语言 可 以 使 用 函数 形 参 、 局 部 变量 和 代码 标号 。 由 
于 本 例 是 由 Microsoft Visual C++ 编译 的 Win32 控制 台 应 用 ， 因 此 其 无 符号 整数 类 型 为 32 位 : 


void TranslateBuffer( char * buf, 
unsigned count, unsigned char eChar ) 


{ 
asm { 
mov esi,buf 
mov ecx,count 
mov al,eChar 
Ll1: 
xor [esi],al 
inc esi 
loop L1 
} // asm 
} 


C++ 模块 ”C++ 启动 程序 从 命令 行 读 取 输入 和 输出 文件 名 。 在 循环 内 调用 TranslateBuffer 
从 文件 读 取 数据 块 ， 加 密 ， 再 将 转换 后 的 缓冲 区 写 入 新 文件 : 


// ENCODE .CPP 一 一 复制 并 加 密 文件 。 
#include <iostream> 

#include <fstream> 

#include "translat.h" 


using namespace std; 


int main( int argcount, char * args[] ) 
{ 
// 从 命令 行 读 取 输入 和 输出 文件 。 
Lft ArgG0unt <,.3 ,+ 
cout << "Usage: encode infile outfile" << endl; 
return -1; 


} 


const int BUFSIZE = 2000; 
char buffer[BUFSIZE]; 
unsigned int count; // 字符 计数 


unsigned char encryptCode; 
cout << "Encryption code [0-255]? "; 
cin >> encryptCode; 


ifstream infile( args[1], ios::binary ); 
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ofstream outfile( args[2], ios::binary ); 
cout << "Reading" << args[1] << "and creating" 
<< args[2] << endl; 


while (!infile.eof() ) 


{ 
infile.read(buffer, BUFSIZE); 











567 count = infile.gcount(); 





TranslateBuffer(buffer, count, encryptCode); 
outfile.write(buffer, count); 


} 


return 0; 


} 


用 命令 提示 符 运 行 该 程序 ， 并 传递 输入 和 输出 文件 名 是 最 容易 的 。 比 如 ， 下 面 的 命令 行 
读 取 infile.txt， 生 成 encoded.txt: 


encode infile.txt encoded .七 xt 


头 文件 “ 头 文件 translat.h 包含 了 TanslateBuffer 的 一 个 函数 原型 : 


void TranslateBuffer(char * buf, unsigned count, 
unsigned char eChar); 


此 程序 位 于 本 书 \Examples\ch13\VisualCPP\Encode 文件 夹 。 

过 程 调用 的 开销 

如 果 在 调试 器 调试 程序 时 查看 Disassembly 窗口 ， 那 么 ， 看 到 函数 调用 和 返回 究 竞 有 
多 少 开 销 是 很 有 趣 的 。 下 面 的 语句 将 三 个 实 参 送 和 人 堆栈， 并 调用 TranslateBuffer。 在 Visual 
C++ 的 Disassembly 窗口 ， 激 活 Show Source Code 和 Show Symbol Names 选项 : 


; TranslateBuffer(buffer, count, encryptCode) 
mov al,byte ptr [encryptCode] 

push eax 

mov ecx,dword ptr [count] 

push ecx 

lea edx, [buffer] 

push edx 

call TranslateBuffer (4159BFh) 

add esp,0ch 


下 面 的 代码 对 TranslateBuffer 进行 反 汇 编 。 编 译 器 自动 插入 了 一 些 语 句 用 于 设置 EBP， 
以 及 保存 标准 寄存 器 集合 ， 集 合 内 的 寄存 器 不 论 是 否 真 的 会 被 过 程 修改 ， 总 是 被 保存 。 


push ebp 
mov ebp,esp 
sub esp,40h 
push ebx 
push esi 
push edi 
;内 嵌 代 码 从 这 里 开始 。 
mov esi,dword ptr [buf] 
mov ecx,dword ptr [count] 
mov al,byte ptr [echar] 
568 汉王 
xor byte ptr [esil],al 
inc esi 


loop Ll1 (41D762h) 
; 内 网 代 码 结束 。 
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pop edi 
pop esi 
pop ebx 
mov esp,ebp 
pop ebp 


ret 


若 关 闭 了 调试 器 Disassembly 窗口 的 Display Symbol Names 选项 ， 则 将 参数 送 入 寄存 器 
的 三 条 语句 如 下 : 


mov esi,dword ptr [ebp+8] 

mov ecx,dword ptr [ebp+0Ch] 

mov al,byte ptr [ebp+10h] 

编译 器 按 要 求生 成 Debug 目标 代码 ， 这 是 非 优化 代码 ， 适 合 于 交互 式 调试 。 如 果 选 择 
Release 目标 代码 ， 那 么 编译 器 生成 的 代码 就 会 更 加 有 效 (但 易 读 性 更 差 )。 

忽略 过 程 调用 “本 小 节 开 始 时 给 出 的 TranslateBuffer 中 有 6 条 内 矢 指令 ， 其 执行 总 共 需 
要 8 条 指令 。 如 果 函 数 被 调用 几 千 次 ， 那 么 其 执行 时 间 就 比较 可 观 了 。 为 了 消除 这 种 开销 ， 
把 内 艇 代码 插入 调用 TranslateBuffer 的 循环 ， 得 到 更 为 有 效 的 程序 ; 


while (!infile.eof() ) 
{ 
infile.read(buffer, BUFSIZE ); 
count = infile.gcount(); 
_asmft 
lea esi,buffer 
mov ecx,count 
mov al,encryptCode 
Ll: 
xor [esi],al 
inc esi 
Loop Ll 
} // asm 
outfile.write(buffer, count); 


} 
程序 位 于 本 书 \Examples\ch13\VisualCPP\Encode_Inline 文件 夹 。 


13.2.3 ”本 节 回 顾 


1. 内 艇 汇编 代 码 与 内 艇 C++ 过 程 有 什么 不 同 之 处 ? 

2. 与 使 用 外 部 汇编 过 程 相 比 ， 内 内 汇编 代码 有 什么 优势 ? 

3. 给 出 至 少 两 种 在 内 肉 汇 编 代码 中 添加 注释 的 方法 。 

4.( 是 / 否 ): 内 嵌 语 言 是 否 可 以 引用 asm 块 之 外 的 代码 标号 ? 


13.3 32 位 汇编 程序 与 C/C++ 的 链接 


为 设备 驱动 器 和 典 入 式 系 统 编 码 的 程序 员 常 常 需要 把 C/C++ 模块 与 用 汇编 语言 编写 的 
专门 代码 集成 起 来 。 汇 编 语 言 特别 适合 于 直接 硬件 访问 、 位 映射 ， 以 及 对 寄存 器 和 CPU 状 
态 标 识 进行 底层 访问 。 整 个 应 用 程序 都 用 汇编 语言 编写 是 很 乏味 的 ， 比 较 有 用 的 方法 是 ， 用 
C/C++ 编写 主 程序 ， 而 那些 不 太 好 用 C 编写 的 代码 则 用 汇编 语言 。 现 在 来 讨论 从 32 位 C/ 
C++ 程序 调用 汇编 程序 的 一 些 标准 要 求 。 

C/C++ 程序 从 右 到 左 传递 参数 ， 与 参数 列表 的 顺序 一 致 。 函 数 返回 后 ， 主 调 程序 负责 将 
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堆栈 恢复 到 调用 前 的 状态 。 这 可 以 采用 两 种 方法 : 一 种 是 将 堆栈 指针 加 上 一 个 数值 ， 该 值 等 
于 参数 大 小 ; 还 有 一 种 是 从 堆栈 中 弹出 足够 多 的 数 。 

在 汇编 源 代 码 中 ， 需 要 在 .MODEL 伪 指令 中 指定 C 调用 规范 ， 并 为 外 部 C/C++ 程序 调 
用 的 每 个 过 程 创建 原型 。 示 例如 下 : 


.586 
model flat,c 
IndexOf PROTO, 
srchVal :DWORD, arrayPtr:PTR DWORD, count:DWORD 


函数 声明 在 C 程序 中 ， 声 明 外 部 汇编 过 程 时 要 使 用 extern 限定 符 。 比 如 ， 下 面 的 语 
句 声明 了 IndexOf: 


extern long IndexOf( long n, long array[], unsigned count ) 


如 果 过 程 会 被 C++ 程序 调用 ， 就 要 添加 “C” 限 定 符 ， 以 防止 C++ 的 名 称 修饰 : 
extern "C" long Indexof( Long n, long array[], unsigned count ); 


名 称 修饰 ( name decoration) 是 一 种 标准 C++ 编译 技术 ， 通 过 添加 字符 来 修改 函数 名 ， 
添加 的 字符 指明 了 每 个 函数 参数 的 确切 类 型 。 任 何 支持 函数 重 载 (多 个 函数 有 相同 的 函数 
名 、 不 同 的 参数 列表 ) 的 语言 都 需要 这 个 技术 。 从 汇编 语言 程序 员 的 角度 来 看 ， 名 称 修饰 存 
在 的 问题 是 : C++ 编译 器 让 链接 器 去 找 的 是 修饰 过 的 名 称 ， 而 不 是 生成 可 执行 文件 时 的 原始 
名 称 。 


13.3.1 IndexOf 示例 


现在 新 建 一 个 简单 汇编 函数 ， 对 数组 实现 线性 搜索 ， 找 到 与 样本 整数 匹配 的 第 一 个 实 
例 。 如 果 搜 索 成 功 ， 则 返回 匹配 元 素 的 索引 位 置 ; 否则 ， 返 回 -1。 该 函数 将 被 C++ 程序 调 
用 。 在 C++ 中 ， 编 写 程序 段 如 下 : 

long Indexof( long searchVval, long array[], unsigned count ) 

b for(unsigned i = 0; i < count; i++) { 

if( array[i] == SearchVal ) 
return i; 
} 


return -1; 


} 


参数 包括 : 希望 被 找到 的 数值 、 一 个 数组 指针 ， 以 及 数组 大 小 。 用 汇编 语言 编写 该 函 
数 显 然 是 很 容易 的 。 编 写 好 的 汇编 代码 放 入 自己 的 源 代 码 文件 IndexOf.asm。 这 个 文件 将 被 
编译 为 目标 代码 文件 IndexOf.obj。 使 用 Visual Studio 实现 主 调 C++ 程序 与 汇编 模块 的 编 
译 和 链接 。C++ 项目 将 用 Win32 控制 台 作 为 其 输出 类 型 虽然 也 没有 理由 不 让 它 成 为 图 形 
应 用 程序 。 图 13-3 为 IndexOf 模块 的 源 代码 清单 。 首 先 ， 注 意 到 用 于 测试 循环 的 汇编 代码 
25 ~ 28 行 ， 虽然 代码 量 小 ,但 是 高 效 。 对 要 执行 很 多 次 的 循环 ， 应 试图 使 其 循环 体内 的 指 
令 条 数 尽 可 能 少 : 


25: Ll: cmp [esi+tedi*4],eax 
26: je found 

2 inc edi 

28: loop Ll1 
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: ;IndexOf 函数 (IndexOf .asm) 


a. 


.586 
.model flat,c 
IndexOf PROTO, 
srchVval:DWORD, arrayPtr:PTR DWORD, count:DWORD 


: IndexOf PROC USES ecx esi edi, 
srchVal:DWORD, arrayPtr:PTR DWORD, count:DWORD 


: ;7 对 32 位 整数 数组 执行 线性 搜索 ， 

: ; 寻找 指定 数值 。 如 果 发 现 匹 配 数值 ， 
: ;用 ERX 返 回 该 数值 的 索引 位 置 ; 

: 7 否则 ，EAX 返回 -1。 


mov eax,srchVal  ; 搜索 数值 
mov ecx,count ; 数组 大 小 
mov esi,arrayPtr ;数组 指针 
mov edi,0 ; 索引 


1 
2 
3s 
4: 
Ss 
G2 
了 
8: 
$s 
10 
11? 
12s 
3 
14 
15 
16 
17s 
18: 
9 
20: 


21 


DONNDN 
WN 
me 


:cmp [esitedi*4],eax 
je found 

inc edi 

loop Ll1 


ID IND 
-To 


ww IN 
Om 
. ne 


: notFound: 
mov eax,NOT FOUND 
jmp short exit 


Ww Ww 
Nm 


: found: 
mov eax,edi 


2 xits 

ret 

; IndexOf ENDP 
: END 


WWW 
oo ~ 
.0 0 0 


Ca 
Ov 





图 13-3 ”lndexOf 模块 清单 


如 果 找 到 匹配 项 ， 程 序 跳 转 到 34 行 , 将 EDI 复制 到 EAX， 该 寄存 器 用 于 存放 函数 返回 
值 。 在 搜索 期 间 ，EDI 为 当前 索引 位 置 。 


34: found: 
355 mov eax,edi 


如 果 没 有 找到 匹配 项 ， 则 把 -1 赋值 给 EAX 并 返回 : 


30: notFound: 


31s mov eax,NOT FOUND 

32: jmp short exit 

图 13-4 为 主 调 C++ 程序 清单 。 首 先 ， 用 伪 随机 数值 对 数组 进行 初始 化 : 
12: long array[ARRAY SIZE]; 

了 for(unsigned i = 0; i < ARRAY SIZE; i++) 


14: array[i] = rand(); 
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18 一 19 行 提示 用 户 输 入 在 数组 中 搜索 的 数值 : 


18's Cout << “Enter an integer Value to find: "; 
19: cin >> SearchVal; 


23 行 调 用 C 链接 库 的 time 函数 (在 time.h 中 )， 把 从 1970 年 1 月 1 日 起 已 经 过 的 秒 数 
保存 到 变量 startTime: 


571 3 time( &StartTime ); 


26 和 27 行 按照 LOOP_SIZE 的 值 ( 100 000 )， 反复 执行 相同 的 搜索 : 


26 : for( unsigned n = 0; n < LOOP SIZE; n++) 
273 count = IndexOf( searchVal, array, ARRAY SIZE ); 


#include <iostream> 
#include <time.h> 

#include "indexof.h" 
Using namespace std; 


se 


int main( ) 
// 用 仿 因 机 数 填 充 数组 。 
const unsigned ARRAY SIZE = 100000; 
const unsigned LOOP SIZE = 100000; 
char* boolstr[] = {"false",'"'true"}; 


co ~ wb 靖 
ne 0 ee 0 


long array[ARRAY SIZE]; 
for(unsigned i = 0; i < ARRAY SIZE; 
array[il = rand(); 


long searchVval; 

time t startTime, endTime; 

cout << "Enter an integer value to find: "; 
cin >> searchVal; 

cout << "Please wait...\n"; 


// 测试 汇编 函数 。 
time(l &startTime ); 
int count = 0; 


for( unsigned n = 0; n < LOOP SIZE; n++) 
Count = IndexOf( searchVal, array, ARRAY SIZE 


bool found = count != -1; 


time( &endTime ); 
cout << "Elapsed ASM time: " << long(endTime - startTime) 
<< " seconds. Found = " << boolstr[found] << endl; 


return 0; 





图 13-4 “C++ 测试 程序 调用 IndexOf 的 代码 清单 


由 于 数组 大 小 也 约 为 100 000， 因 此 执行 步骤 的 总 数 可 以 多 达 100 000x 100 000, 或 
100 亿 。31 ~ 33 行 再 次 检查 时 间 ， 并 显示 循环 运行 所 耗 的 秒 数 : 


3 time( gendTime ); 
323 cout << "Elapsed ASM time: ”<< long(endTime - startTime) 
33: << " seconds. Found = " << boolstr[found] << endl; 


高 级 语言 规 口 453 


在 高 速 计算 机 上 测试 时 ,循环 执行 时 间 为 6 秒 。 对 100 亿 次 迭代 而 言 ， 这 个 时 间 不 算 
多 ， 每 秒 约 有 16.7 亿 次 和 迭代。 重要 的 是 ， 需 要 意识 到 程序 重复 过 程 调用 的 开销 (参数 人 栈 ， 
执行 CALL 和 RET 指令 ) 也 是 100 000 次 。 过 程 调 用 导致 了 相当 多 的 额外 处 理 。 


13.3.2 调用 C 和 C++ 函数 


可 以 编写 汇编 程序 来 调用 C 和 C++ 函数 。 这 样 做 的 理由 至 少 有 两 个 : 
e C 和 C++ 有 丰富 的 输入 -输出 库 ， 因 此 输入 -输出 有 更 大 的 灵活 性 。 处 理 浮 点 数 时 ， 
这 是 相当 有 用 的 。 
e。 两 种 语言 都 有 丰富 的 数学 库 。 
调用 标准 C 库 (或 C++ 库 ) 函数 时 ， 必 须 从 C 或 C++ 的 main( ) 过 程 启动 程序 ， 以 便 运 
行 库 初始 化 代码 。 
1. 函数 原型 


汇编 语言 代码 调用 的 C++ 函数 ， 必 须 用 “C” 和 关键 字 extern 定义 。 其 基本 语法 如 下 : 
extern "C" returnType funcNamef paramlist ) 


TE 
示例 如 下 : 


extern "C” int askForInteger( ) 

{ 
cout << "Please enter an integer:"; 
| 

} 


与 其 修改 每 个 函数 定义 ， 把 多 个 函数 原型 放 在 一 个 块 内 显得 更 容易 。 然 后 ， 还 可 以 省 略 
单个 函数 实现 的 extermn 和 “C”: 


extern '"'C" { 
int askForInteger(); 
int ShowInt( int value, unsigned outWidth ); 


//etc. 
} 
2. 汇编 语言 模块 
如 果 汇 编 语言 模块 调用 Irvine32 链接 库 过 程 ， 就 要 使 用 如 下 .MODEL 伪 指 令 : 


model flat, STDCALL 


虽然 STDCALL 与 Win32 API 兼容 ,但 是 它 与 C 程序 的 调用 规范 不 匹配 。 因 此 ， 在 声 
明 由 汇编 模块 调用 的 外 部 C 或 C++ 函数 时 ， 必 须 给 PROTO 伪 指 令 加 上 C 限定 符 : 


INCLUDE Irvine32 .inc 
aSkForInteger PROTO C 
showInt PROTO C, value:SDWORD, outWidth:DWORD 


C 限定 符 是 必要 的 ， 因 为 链接 器 必须 把 函数 名 与 C++ 模块 输出 的 参数 列表 匹配 起 来 。 
此 外 ,使 用 了 C 调用 规范 ， 汇 编 器 必须 生成 正确 的 代码 以 便 在 函数 调用 后 清除 堆栈 (参见 
8.2.4 节 )。 

C++ 程序 调用 的 汇编 过 程 也 必须 使 用 C 限定 符 ， 这 样 汇编 器 使 用 的 命名 规则 将 能 被 链 
接 器 识别 。 比 如 ， 下 面 的 SetTextColor 过 程 有 一 个 双 字 参数 : 


~ 
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SetTextOutColor PROC C， 
color :DWORD 


SetTextOutColor ENDP 


最 后 ， 如 果 汇 编 代 码 调用 其 他 汇编 过 程 ，C 调用 规范 要 求 在 每 个 过 程 调用 后 ， 把 参数 从 
堆栈 中 移 除 。 

使 用 .MODEL 伪 指 令 ”如 果 汇 编 代码 不 调用 Irvine32 过 程 ， 就 可 以 在 .MODEL 伪 指 令 
中 使 用 C 调用 规范 : 

; (do not INCLUDE Irvine32.inc) 

.586 

model flat,c 


此 时 不 再 需要 为 PROTO 和 PROC 伪 指 令 添加 C 限定 符 : 


askForInteger PROTO 
showInt PROTO, value:SDWORD, outWidth:DWORD 


SetTextOutColor PROC, 
color:DWORD 


SetTextOutColor ENDP 


3. 函数 返回 值 

C++ 语言 规范 没有 提 及 代码 实现 细节 ， 因 此 没有 规定 标准 方法 让 C 和 C++ 函数 返回 数 
值 。 当 编写 的 汇编 代码 调用 这 些 语言 的 函数 时 ， 要 检查 编译 器 文件 以 便 了 解 它们 的 函数 是 如 
何 返回 数值 的 。 下 面 列 出 了 一 些 可 能 的 情况 ， 但 并 非 全 部 : 

e 整数 用 单个 寄存 器 或 寄存 器 组 返回 - 

e 主 调 程序 可 以 在 堆栈 中 为 函数 返回 值 预 留 空间 。 函 数 在 返回 前 ， 可 以 将 返回 值 存 人 

堆栈 。 

e 函数 返回 前 ， 浮 点 数值 通常 被 压 人 处 理 器 的 浮 点 数 堆栈 。 

下 面 列 出 了 Microsoft Visual C++ 函数 怎样 返回 数值 : 

e@ bool 和 char 值 用 AL 返回 。 

e@ short int 值 用 AX 返回 。 

e int 和 long int 值 用 EAX 返回 。 

e 指针 用 EAX 返回 。 

e float、double 和 1long double 值 分 别 以 4 字 节 、8 字 节 和 10 字 节 数值 压 人 浮 点 堆栈 。 


13.3.3 ”乘法 表示 例 


现在 编写 一 个 简单 的 应 用 程序 ， 提 示 用 户 输入 整数 ， 通 过 移 位 的 方式 将 其 与 2 的 寡 
(2 一 2 ) 相 乘 ， 并 用 填充 前 导 空 格 的 形式 再 次 显示 每 个 乘积 。 输 入 - 输出 使 用 C++。 汇 编 
模块 将 调用 3 个 C++ 编写 的 函数 。 程 序 将 由 C++ 模块 启动 。 

1. 汇编 语言 模块 

汇编 模块 包含 一 个 函数 DisplayTable。 它 调用 C++ 函数 askForInteger 从 用 户 输入 一 个 
整数 。 它 还 使 用 循环 结构 把 整数 intVal 重复 左 移 ， 并 调用 showInt 进行 显示 。 
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;C++ 调用 的 ASM 函数 
INCLUDE Irvine32.inc 


; 外 部 C++ 函数 : 

askForInteger PROTO C 

showInt PROTO C, value:SDWORD, outWidth:DWORD 
newLine PROTO C 


OUT WIDTH = 8 
ENDING POWER = 10 


.data 
intVal DWORD ? 


SetTextOutColor PROC C, 
color:DWORD 


; 设置 文本 颜色 ， 并 清除 控制 台 窗口 。 
; 调用 Irvine32 库 函 数 。 


Ee 
mov eax,color 
call SetTextColor 
all ‘CLrsor 
ret 
SetTextOutColor ENDP 


DisplayTable PROC C 


; 输入 一 个 整数 口 并 显示 范围 为 ny2: ~ nx2i 的 乘法 表 。 


INVOKE askForIntegeL ; 调用 C++ 函数 
mov intVal,eax ; 保存 整数 
mov ecx,ENDING POWER ; 循环 计数 器 
Ll: push ecx ;保存 循环 计数 器 
shl intVval,l ; 乘 以 2 
INVOKE ShowInt, intVal,OUT_WIDTH 
call Crlf 7 输出 CR/LF 
pop ecx ; 恢复 循环 计数 器 
loop Ll 
ret 
DisplayTable ENDP 


END 


在 DisplayTable 过 程 中 ， 必 须 在 调用 showInt 和 newLine 之 前 将 ECX 人 栈 ， 并 在 调用 
后 将 ECX 出 栈 ， 这 是 因为 Visual C++ 函数 不 会 保存 和 恢复 通用 寄存 器 。 函 数 askForInteger 
用 EAX 寄存 器 返回 结果 。 

DisplayTable 在 调用 C++ 函数 时 不 一 定 要 用 INVOKE。PUSH 和 CALL 指令 也 能 得 到 同 
样 的 结果 。 对 showInt 的 调用 如 下 所 示 : 


push OUT_WIDTH ; 最 后 一 个 参数 首先 入 模 
push IntVal 
call showInt ; 调用 函数 


add esp,8 ; 清除 堆栈 


必须 遵守 C 语言 调用 规范 ， 其 参数 按照 逆序 入 栈 ， 且 主 调 方 负责 在 调用 后 从 堆栈 移 除 
参 。 


将 


576 


577 
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2. C++ 测试 程序 


下 面 查看 启动 程序 的 C++ 模块 。 其 人 口 为 main( ), 保证 执行 所 需 C++ 语言 的 初始 化 代 
码 。 它 包含 了 外 部 汇编 过 程 和 三 个 输出 函数 的 原型 : 


// main.cpp 
// 演示 C++ 程序 和 外 部 汇编 模块 之 间 的 函数 调用 。 


#include <iostream> 
#include <iomanip> 
using namespace std; 


extern "CcC" { 
// 外 部 ASM 过 程 ; 
void DisplayTable!( ); 
void SetTextOutColor(unsigned color); 
// 局 部 C++ 函数 : 
int askForInteger(); 
void showInt(int value, int width) 


} 


// 程序 入 口 

int main() 

{ 
SetTextOutColor( 0xlE );// 蓝 底 黄 字 
DisplayTable(); // 调用 ASM 过 程 
return 0; 


} 


// 提示 用 户 输入 一 个 整数 。 


int askForIinteger!() 


{ 
int n; 
cout << "Enter an integer between 1 and 90,000:"; 
和 
return n; 
} 


// 按 特定 宽度 显示 一 个 有 符号 整数 。 
void showInt( :int value, int width ) 
{ 

cout << setw(lwidth) << value; 


} 


生成 项 目 将 C++ 和 汇编 模块 添加 到 Visual Studio 项 目 ， 并 在 Project 菜 单 中 选择 


Build Solution。 
程序 输出 ” 当 用 户 输入 为 90 000 时 ， 乘 法 表 程 序 产 生 的 输出 如 下 : 


Enter an integer between 1 and 90,000: 90000 
180000 
360000 


720000 


1440000 
2880000 
5760000 
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11520000 
23040000 


46080000 
92160000 





3. Visual Studio 项 目 属性 

如 果 使 用 Visual Studio 生成 集成 了 C++ 和 汇编 代码 的 程序 ， 并 且 调 用 Irvine32 链接 
库 ， 就 需要 修改 某 些 项 目 设 置 。 以 Multiplication Table 程序 为 例 。 在 Project 菜 单 中 选 
择 Properties， 在 窗口 左边 的 Configuration Properties 条 目下 ， 选 择 Linker。 在 右边 面板 
的 Additional Library Directories 条 目 中 输入 ci\Irvine。 示 例如 图 13-5 所 示 。 点 击 OK 关闭 
Project Property Pages 窗口 。 现 在 Visual Studio 就 可 以 找到 Irvine32 链接 库 了 。 

上 述 过 程 已 在 Visual Studio 2012 中 测试 通过 ， 但 可 能 会 有 变更 。 请 查阅 我 们 的 网 站 
(www.asmirvine.com) 获取 更 新 。 

















图 13-5 指定 Irvine32.lib 的 位 置 


13.3.4 调用 C 库 函 数 


C 语言 有 标准 函数 集合 ， 被 称 为 标准 C 库 (Standard C Library)。 同 样 的 函数 还 可 以 用 
于 C++ 程序， 因此， 也 可 用 于 与 C 和 C++ 程序 连接 的 汇编 模块 。 汇 编 模块 调用 C 函数 时 ， 
就 必须 包含 函数 的 原型 。 一 般 通过 访问 C++ 编译 器 的 帮助 系统 可 以 找到 C 函数 原型 。 程 序 
调用 C 函数 时 ， 需 要 先 将 C 函数 原型 转换 为 汇编 语言 原型 。 

printf 函数 ”下面 是 printf 函数 的 C/C++ 语言 原型 ， 第 一 个 参数 为 字符 指针 ， 其 后 跟 了 
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一 组 可 变数 量 的 参数 : 
int Pintf( 
const char *format [, argument]... 
); 
( C/C++ 编译 器 的 帮助 库 可 以 查阅 到 printf 函数 文档 。) 汇编 语言 中 与 之 等 效 的 函数 原型 
将 char* 改 为 PTR BYTE， 将 可 变 长 度 参数 列表 的 类 型 改 为 VARARG : 


printf PROTO C, pString:PTR BYTE, args:VARARG 


另 一 个 有 用 的 函数 是 scanf， 用 于 从 标准 输入 (键盘 ) 接收 字符 、 数 字 和 字符 串 ， 并 将 输 
入 数值 分 配给 变量 : 


scanf PROTO C, format:PTR BYTE, args:VARARG 


1. 用 printf 函数 显示 格式 化 实数 

编写 汇编 函数 格式 化 并 显示 浮 点 数 不 是 一 件 容 易 的 事 。 与 其 由 程序 员 自行 编码 ， 还 不 如 
利用 C 库 的 printf 函数 。 需 要 创建 C 或 C++ 的 启动 模块 ， 并 将 其 与 汇编 代码 链接 。 下 面 给 
出 了 用 Visual C++.NET 创建 这 种 程序 的 过 程 : 

1 ) 用 Visual C++ 创建 一 个 Win32 控制 台 程序 。 创 建文 件 main.cpp， 并 插入 函数 main， 
该 函数 调用 了 asmMain : 


extern "C”Vvoid asmMain( ); 


int main( ) 

{ 
asmMain( ); 
return 0; 


} 


2 ) 在 main.cpp 所 在 的 文件 夹 中 ,创建 一 个 汇编 模块 asmMain.asm。 该 模块 包含 过 程 
asmMain， 并 声明 使 用 C 调用 规范 : 


; asmMain.asm 

.386 

.model flat,stdcall 
.Stack 2000 

.Code 

asmMain PROC C 


ret 
asmMain ENDP 
END 


3 ) 汇编 asmMain.asm (但 不 进行 链接 )， 生 成 asm Main.obj。 

4 ) 将 asmMain.obj 添加 到 C++ 项 目 。 

5 ) 构建 并 运行 项 目 。 如 果 修 改 了 asmMain.asm， 则 在 运行 前 ， 需 要 再 一 次 汇编 和 构建 
项 目 。 

一 旦 程序 正确 建立 ， 就 可 以 向 asmMain.asm 添加 代码 来 调用 C/C++ 函数 。 

显示 双 精 度数 值 下 面 是 asmMain 中 的 汇编 代码 ， 它 通过 调用 printf 输出 了 一 个 类 型 为 
REALS8 的 数值 : 
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data 

doublel REAL8 1234567.890123 
formatStr BYTE "%.3f",0dh,0ah,0 

.Code 

INVOKE printf, ADDR formatStr，doublel 


相应 的 输出 如 下 : 


1234567.890 


这 里 ， 传 递 给 printf 的 格式 化 字符 串 与 C++ 中 的 略 有 不 同 : 不 是 插 人 转 义 字符 ， 如 \n， 
而 是 必须 插入 ASCII 字符 (0dh，0ah ) 。 









传递 给 printf 的 浮 点 参数 应 声明 为 REAL8 类 型 。 不 过 传递 的 数值 也 可 能 是 REAL4 类 
型 ， 这 需要 相当 的 编程 技巧 。 若 想 了 解 C++ 编译 器 是 如 何 工 作 的 ， 可 以 声明 一 个 float 类 
型 的 变量 ， 并 将 其 传递 给 printf。 编 译 程序 ， 并 用 调试 器 跟踪 该 程序 的 反 汇 编 代 码 。 


多 参数 ”printf 函数 接收 可 变数 量 的 参数 ， 因 此 很 容易 在 一 次 函数 调用 中 对 两 个 数 进 行 
格式 化 并 显示 它们 : 


TAB = 9 

-data 

formatTwo BYTE “"%.2f",TAB,"%®%.3f",0dh,0ah,0 
vall REAL8 456.789 

val2 RERL8 864.231 

"code 

INVOKE printf, ADDR formatTwo, vall, val2 


相应 的 输出 如 下 : 


456.79 864.231 ' 


(参见 本 书 Examples\ch13\VisualCPP 文件 夹 内 的 项 目 Printf_Example。) 

2. 用 scanf 函数 输入 实数 

调用 scanf 可 以 从 用 户 输入 浮 点 数 。SmallWin.inc (包括 在 Irvine32.inc 内 ) 定义 的 函数 
原型 如 下 所 示 : 


scanf PROTO C, 
format:PTR BYTE, args:VARARG 


传递 给 它 的 参数 包括 : 格式 化 字符 串 的 偏 移 量 ， 一 个 或 多 个 REAL4、REALS8 类 型 变量 
的 偏 移 量 (这 些 变量 存放 了 用 户 输入 的 数值 ) 。 调 用 示例 如 下 : 


.data 

strSingle BYTE "“"%f",0 

strDouble BYTE "%1f",0 

singlel REAL4 2? 

doublel REALS8 ? 

.Code 

INVOKE scanf, ADDR strSingle，RDDR singlel 
INVOKE scanf, ADDR strDouble, ADDR doublel 


必须 从 C 或 C++ 启动 程序 中 调用 汇编 语言 代码 。 


13.3.5 ”目录 表 程 序 
现在 编写 一 个 简短 的 程序 ， 清 除 屏幕 ， 显 示 当 前 磁盘 目录 ， 并 请 求 用户 输 入 文件 名 。 






460 甸 13 划 


(程序 员 可 能 希望 扩展 该 程序 ， 以 打开 并 显示 被 选中 文件 。) 
C++ 根 模 块 ”C++ 模块 只 有 一 个 对 asm_main 的 调用 ， 因 此 可 以 将 其 称 为 根 模块 (stub 


module ): 


// main.cpp 
// 根 模块 : 启动 汇编 程序 


extern "C" void asm main(); // asm 启动 过 程 


void main() 
{ 
asm main(); 


} 


ASM 模块 ”汇编 语言 模块 包括 了 函数 原型 、 若 干 字 符 串 和 一 个 fileName 变量 。 模 块 两 
次 调用 system 函数 ， 向 其 传递 “ cls” 和 “dir” 命 令 。 然 后 调用 printf， 显 示 请 求 文件 名 的 
提示 行 ， 再 调用 scanf， 使 用 户 输入 文件 名 。 程 序 不 调用 Irvine32 库 中 的 任何 函数 ， 因 此 可 
以 将 .MODEL 伪 指 令 设置 为 C 语言 规范 : 


? 从 C++ 启动 的 RSM 程序 (asmMain.asm) 


.586 
.MODEL flat,c 


; 标准 C 库 函 数 : 

system PROTO, pCommand:PTR BYTE 

printf PROTO, pString:PTR BYTE, args:VARARG 

scanf PROTO, pFormat:PTR BYTE,pBuffer:PTR BYTE, args:VARARG 
fopen PROTO, mode:PTR BYTE, filename:PTR BYTE 

fclose PROTO, pFile:DWORD 


BUFFER SIZE = 5000 

.data 

strl ‘BYTE "cls",0 

Str2 BYTE, "dir/w"s0 

str3 BYTE "Enter the name of a file:",0 

str4 BYTE "%s",0 

str5 BYTE “cannot open file",0dh,0ah,0 

str6é BYTE "The file has been opened'",0dh,0ah,0 
modeStr BYTE "r",0 


fileName BYTE 60 DUP(0) 
PBuf DWORD ? 
pFile DWORD ? 


.Code 

asm main PROC 

; 清除 屏幕 ， 显 示 磁 盘 目 录 

INVOKE system,ADDR strl 

INVOKE system,ADDR str2 

; 请 求 文件 名 

INVOKE printf,ADDR str3 

INVOKE scanf, ADDR str4, ADDR filename 
; 尝试 打开 文件 

INVOKE fopen, ADDR fileName, ADDR modestr 
mov pFile,eax 


.IF eax == ; 不 能 打开 文件 ? 
INVOKE printf,ADDR str5 
jmp quit 


.ELSE 
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INVOKE printf,ADDR str6 
» ENDIF 


INVOKE fclose, pFile 
quits 

ret ? 返回 C++ 主 程序 
asm main ENDP 
END 


函数 scanf 需要 两 个 参数 : 第 一 个 是 格式 化 字符 串 (“ %s”) 的 指针 ， 第 二 个 是 输入 字 
符 串 变量 ( fileName) 的 指针 。 因 为 互联 网 上 有 丰富 的 文档 ， 因 此 这 里 不 再 浪费 时 间 来 解 
释 标 准 C 函数 。 一 个 很 好 的 参考 文献 是 1988 年 Prentice Hall 出 版 的 《 The C Programming 
Language 》 第 二 版 ， 其 作者 是 Brian W. Kernighan 和 Dennis M. Ritchie。 


13.3.6 ”本 节 回 顾 


1. 若 函 数 被 汇编 模块 调用 ， 则 函数 定义 中 必须 包括 哪 两 个 C++ 关键 字 ? 

2. 什么 情况 下 Irvine32 库 使 用 的 调用 规范 与 C 和 C++ 语言 使 用 的 调用 规范 不 兼容 ? 
3. C++ 函数 通常 怎样 返回 浮 点 数 ? 

4. Microsoft Visual C++ 函数 怎样 返回 short int 类 型 的 数值 ? 


13.4 本章 小 结 


若 要 对 某 些 高 级 语言 编写 的 大 型 应 用 程序 中 的 指定 部 分 进行 优化 ， 那 么 汇编 语言 堪 称 是 
完美 的 工具 。 同 时 ， 汇 编 语言 也 是 为 特定 硬件 定制 一 些 程序 的 好 工具 。 选 择 以 下 两 种 方法 之 
一 可 以 实现 这 些 技术 : 

e 在 高 级 语言 代码 中 编写 内 徐汇 编 代 码 。 

e 把 汇编 程序 链接 到 高 级 语言 代码 。 

两 种 方法 都 有 其 有 优点 和 局 限 性 。 本 章 对 这 两 种 方法 都 进行 了 介绍 。 

语言 使 用 的 命名 规范 是 指 段 和 模块 的 命名 方式 ， 也 就 是 与 变量 和 过 程 命名 相关 的 规则 或 
特性 。 程 序 使 用 的 内 存 模式 决定 了 调用 和 引用 是 近 ( 同 一段 内 ) 还 是 远 (不 同 段 间 )。 

从 其 他 语言 程序 中 调用 汇编 过 程 时 ， 在 两 种 语言 代码 中 都 用 到 的 标识 符 必须 是 兼容 的 。 
在 汇编 过 程 中 使 用 的 段 名 也 要 与 主 调 程序 兼容 。 过 程 编 写 者 使 用 的 高 级 语言 调用 规范 决定 了 
如 何 接收 参数 。 调 用 规范 影响 下 列 情形 : 是 由 被 调 过 程 恢复 堆栈 指针 ， 还 是 由 主 调 程序 恢复 
堆栈 指针 。 

在 Visual C++ 中 ， 伪 指令 ”asm 用 于 在 C++ 源 程 序 中 编写 内 嵌 汇 编 代 码 。 本 章 的 文件 
加 密 程序 演示 了 内 赂 汇编 语言 。 

本 章 展 示 了 怎样 将 汇编 过 程 链接 到 运行 于 32 位 保护 模式 的 Microsoft Visual C++ 程序 。 

调用 标准 C (C++) 库 函 数 时 ， 需 用 C 或 C++ 创建 含有 main() 函数 的 根 程序 。main() 开 
始 时 ， 编 译 器 的 运行 时 链接 库 自动 初始 化 。 在 main() 中 可 以 调用 汇编 模块 的 启动 过 程 。 汇 
编 语言 模块 可 以 调用 标准 C 库 中 的 所 有 函数 。 

过 程 IndexOf 用 汇编 语言 编写 ， 且 被 Visual C++ 程序 调用 。 本 章 还 查看 了 Microsoft 
C++ 编译 器 生成 的 汇编 源 文件 ， 对 编译 器 如 何 优化 代码 有 了 更 清楚 的 了 解 。 
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13.5 关键 术语 


C language specifier (C 语言 说 明 符 ) name decoration (名称 修 饰 ) 

external identifier (外 部 标识 符 ) naming convention (命名 规范 ) 

inline assembly code (内 嵌 汇 编 代 码 ) STDCALL language specifier (STDCALL 语言 说 
memory model (内 存 模 式 ) 明 符 ) 

13.6 复习 题 


1. 当 汇 编 过 程 被 高 级 语言 程序 调用 时 ， 主 调 程序 与 被 调 过 程 是 否 应 使 用 相同 的 内 存 模 式 ? 
2. C 和 C++ 程序 调用 汇编 过 程 时 ， 为 什么 区 分 大 小 写 是 很 重要 的 ? 

3. 一 种 编程 语言 的 调用 规范 是 否 包 括 了 过 程 对 某 些 寄存 器 的 保存 规定 ? 

4.( 是 / 否 ): EVEN 和 ALIGN 伪 指 令 是 否 都 能 用 于 内 嵌 汇 编 代 码 ? 

5.( 是 / 否 ): OFFSET 运算 符 是 否 能 用 于 内 肉 汇 编 代码 ? 

6.( 是 / 否 ): 内 艇 汇编 代码 中 ，DW 和 DUP 运算 符 是 否 都 能 用 于 变量 定义 ? 

7. 使 用 _fastcall 调用 规范 时 ， 若 内 赃 汇 编 代 码 修改 了 寄存 器 会 出 现 什么 情况 ? 

8. 不 使 用 OFFSET 运算 符 ， 是 否 还 有 其 他 方法 能 把 变量 偏 移 量 送 人 变 址 寄存 器 ? 
9. 对 32 位 整数 数组 使 用 LENGTH 运算 符 ， 其 返回 值 是 多 少 ? 

10. 对 长 整 型 数组 使 用 SIZE 运算 符 ， 其 返回 值 是 多 少 ? 

11. 标准 C printf() 函数 的 有 效 汇编 PROTO 声明 是 怎样 的 ? 

12. 调用 如 下 C 语言 函数 ， 实 参 x 是 最 先 人 栈 还 是 最 后 人 栈 ? 


void MySub( x, y, z ); 


13. 过 程 被 C++ 调用 时 ， 其 外 部 声明 使 用 的 “C” 说 明 符 有 什么 作用 ? 
14. C++ 调用 外 部 汇编 过 程 时 ， 为 什么 名 称 修饰 是 重要 的 ? 
15. 搜索 互联 网 ， 用 简 表 列 出 C/C++ 编译 器 使 用 的 优化 技巧 。 


13.7 ”编程 练习 


六 1. 数组 与 整数 相 乘 


编写 汇编 子 程序 ， 实 现 一 个 双 字 数组 与 一 个 整数 的 乘法 。 编 写 C/C++ 测试 程序 ， 新 建 数组 并 
将 其 传递 给 子 程序 ， 再 输出 运算 后 的 结果 数组 。 


*** 2. 最 长 递增 序列 
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编写 汇编 子 程序 ， 接 收 两 个 输入 参数 : 数组 偏 移 量 和 数组 大 小 。 子 程序 返回 数组 中 最 长 的 递增 
序列 中 整数 值 的 个 数 。 比 如 ,数组 如 下 所 示 ， 则 最 长 的 严格 递增 序列 开始 于 索引 值 为 3 的 元 素 、 序 
列 长 度 为 4 {14，17，26，42} : 
[和 10, 20. 14; 175 26, 2; 22 19, 3] 

编写 C/C++ 测试 程序 调用 该 子 程序 ， 测 试 程序 实现 的 操作 包括 : 新 建 数 组 、 传 递 参数 、 输 出 
子 程序 的 返回 值 。 


北 3. 三 个 数组 求 和 


编写 汇编 子 程序 ， 接 收 三 个 同样 大 小 数组 的 偏 移 量 。 将 第 二 个 和 第 三 个 数组 加 到 第 一 个 数组 
上 。 子 程序 返回 时 ， 第 一 个 数组 包含 结果 数值 。 编 写 C/C++ 测试 程序 ， 新建 数 组 并 将 其 传递 给 子 
程序 ， 再 显示 第 一 个 数组 的 内 容 。 


463 


***4. 质数 程序 
编写 汇编 过 程 实现 如 下 功能 : 若 传递 给 EAX 的 32 位 整数 为 质数 ， 则 返回 1 ; 车 EAX 为 非 质 
数 ， 则 返回 0。 要 求 从 高 级 语言 程序 调用 该 过 程 。 由 用 户 输入 一 组 整数 ， 对 每 个 数值 ， 程 序 都 要 显 
示 一 条 信息 以 示 该 数 是 否 为 质数 。 建 议 : 第 一 次 调用 该 过 程 时 ， 使 用 厄 拉 多 塞 过 滤 算 法 ( Sieve of 
Eratosthenes) 初始 化 布尔 数组 。 
**5.LastindexOf 过 程 
修改 13.3.1 节 的 IndexOf 过 程 。 将 新 函数 命名 为 LastIndexOf， 使 其 从 数组 末尾 开始 反 向 搜索 。 
遇 到 第 一 个 匹配 值 就 返回 其 索引 ， 和 否则 即 为 未 发 现 匹 配 值 ， 返 回 -1。 
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附录 A | 


Assembly Language for x86 Processors, Seventh Edition 


MASM 参考 知识 





A.1 引言 
Microsoft MASM 6.11 手册 最 后 一 次 印刷 是 在 1992 年 ， 共 有 三 卷 : 
e 程序 员 指南 
e 参考 知识 
e 环境 和 工具 


遗憾 的 是 ,已 经 有 很 多 年 都 没 出 现 过 印刷 版 的 手册 ， 不 过 Microsoft 在 其 Platform SDK 
包 内 提供 了 手册 的 电子 版 (MS-Word 文件 )。 印 刷 版 手册 绝对 已 经 属于 收藏 品 了 。 

本 附录 的 内 容 节选 自 参 考 手 册 的 1 一 3 章 . 并 且 包 含 了 MASM 6.14 readme.txt 文件 的 
更 新 。 本 书 提供 的 Microsoft 许可 协议 授权 读者 拥有 软件 和 随 附 文档 的 一 个 副本 ， 这 里 给 出 
的 是 其 中 的 一 部 分 。 

语法 符号 ”本 附录 使 用 的 语法 符号 是 .- 致 的 。 全 部 用 大 写字 母 表示 的 单词 为 MASM 保 
留 字 ， 在 程序 中 它们 可 能 为 大 写 也 可 能 为 小 写 。 下 面 的 例子 中 DATA 是 保留 字 : 

.DATA 

斜体 字 表 示 已 定义 的 术语 或 类 别 。 下 面 的 例子 中 number 表示 一 个 整数 常量 : 

ALIGN [| number | 

车 某 项 用 双 括 号 括 起 来 [[…]]， 则 该 项 为 可 选 的 。 下 面 的 例子 中 text 是 可 选项 : 

ll text]) 

若 垂直 分 隔 符 出 现在 有 两 个 或 更 多 选项 的 列表 中 ， 就 意味 着 必须 选择 其 中 的 一 项 。 下 面 
的 例子 就 要 在 NEAR 和 FAR 之 间 进 行 选择 : 

NEAR | FAR 

省 略 号 (… ) 表示 重复 列表 的 最 后 一 项 。 在 下 面 的 例子 中 ， 喜 号 及 其 后 的 初始 值 
(initializer) 可 能 会 重复 多 次 : 


l[[name]] BYTE inalizer[ iniralizer] ... 


A.2 MASM 保留 字 











STDCALL 
2 PASCAL SWORD 
@B QWORD SYSCALL 
@F FORTRAN TBYTE 
ADDR VARARG 
BASIC WORD 
BYTE ZERO? 
@ OVERFLOW? 
CARRY? 
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A.3 寄存 器 名 
AH CRO DRI EBX sl 
AL CR2 DR2 ECX SP 
AX CR3 EDI SS 
BH CS DR6 EDX ST 
BL DR7 ES TR3 
BP DH DS ESI TR4 
BX DI ESP TR5 
CH DL FS TR6 
EL DRO EBP GS TR7 


A.4 ”Microsoft 汇编 器 ( ML ) 


ML 程序 (ML.EXE) 汇编 并 链接 一 个 或 多 个 汇编 语言 源 文件 。 语 法 如 下 : 
ML [[options ]] filename lll[options | filename]... [lMink linkoptions ]] 
filename 是 唯一 必需 的 参数 ， 且 至 少 应 有 一 个 ， 该 参数 是 汇编 源 文 件 名 。 比 如 ， 下 面 的 
命令 汇编 源 文 件 AddSub.asm， 并 生成 目标 文件 AddSub.obj: 
ML -c RddSub .asm 
options 参数 或 者 为 空 ， 或 者 包含 多 个 命令 行 选项 ， 每 个 选项 都 以 斜 杠 〈/) 或 破 折 号 (一 ) 
开始 。 若 有 多 个 选项 ， 则 选项 之 间 至 少 用 一 个 空格 分 隔 。 表 A-1 列 出 了 完整 的 命令 行 选项 。 
命令 行 要 区 分 大 小 写 。 
表 A-1 ML 命令 行 选项 
选项 操作 
启用 微型 内 存 模式 支持 。 若 代码 结构 违反 .COM 格式 文件 的 要 求 ， 则 给 出 错误 信息 。 注 意 ， 











aT 该 选项 并 非 完 全 等 同 于 .MODEL TINY 伪 指 令 
/Blfilename 选择 备用 链接 器 
lc 只 汇编 ， 不 链接 





按照 Microsoft 通用 目标 文件 格式 (Common Object File Format) 生成 目标 文件 。 通 常 针对 的 





oof 是 32 位 汇编 语言 ，64 位 汇编 器 不 支持 该 选项 

/cp 保留 所 有 用 户 标识 符 的 大 小 写 

/Cu 所 有 标识 符 都 转换 为 大 写 。64 位 汇编 加 不 支持 该 选项 
/Cx 保留 公共 和 外 部 符号 的 大 小 写 (默认 ) 





按 给 定名 字 定 义 文 本 宏 。 若 value 缺失 ， 则 为 空 。 多 个 符号 用 空格 分 隔 ， 且 需 用 引号 将 符 
号 括 起 
生成 已 预 处 理 的 源 列表 文件 ( 送 STDOUT)。 参 见 /Sf 


/Dsymbol[[=value]] 














/ERRORREPORT 
[NONEIPROMPTI| 
QUEUEISEND] 


若 运 行 时 汇编 失败 ， 则 向 Microsoft 发 送 诊断 信息 






将 堆栈 大 小 设置 为 hexnum 个 字 节 ( 同 /link/STACK : number)。 数 值 必须 用 十 六 进 制 表示 ， 
且 /Ff 和 hexnum 之 间 必 须 有 一 个 空格 
为 可 执行 文件 命名 

生成 汇编 代码 列表 文件 。 参见 /Sf 


/Fhexnum 









/Fefilename 
/Fl[[filename]] 
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选项 
/Fml[filename]] 
/Fofilename 
/FPi 
/Fr{[filename]] 
/FR[[filename]] 
/Gc 
/Gd 
/Gz 
/H number 
/help 
/Lpathname 
/link 
/nologo 
/omf 
/Sa 
/safeseh 
/Sf 
/Sl width 
/Sn 
/Sp length 


/Ss text 

/St text 

/Sx 

/Ta filename 
Iw 

/Wlevel 


/Zm 
/Zpl[[lalignment]] 
/Zs 

A 


府 胁 A 


( 续 ) 
操作 
创建 链接 .MAP 文件 
为 目标 文件 命名 
生成 浮 点 算术 运算 的 模拟 器 修正 (只 适用 于 混合 语言 )。64 位 汇编 器 不 支持 该 选项 
生成 .SBR 源 浏览 文件 
生成 扩展 格式 的 .SBR 源 浏览 文件 
指定 使 用 FORTRAN 或 Pascal 风格 的 调用 和 命名 规范 。64 位 汇编 器 不 支持 该 选项 
指定 使 用 C 风格 的 调用 和 命名 规范 。64 位 汇编 器 不 支持 该 选项 
使 用 STDCALL 调用 规范 。64 位 汇编 器 不 支持 该 选项 
将 外 部 名 限定 为 number 个 有 效 字符 。 默 认为 31 个 字符 。64 位 汇编 器 不 支持 该 选项 
调用 ML 的 QuickHelp 
设置 包含 文件 路 径 。 最 大 允许 10 个 在 选项 
链接 器 选项 和 库 
禁止 汇编 成 功 的 消息 
生成 OMF( Microsoft 目标 模块 格式 ，Object Module Format) 文件 。 早 期 16 位 Microsoft 链 


接 器 (LINK16.EXE) 要 求 该 格式 。64 位 汇编 器 不 支持 该 选项 


打开 所 有 可 用 信息 列表 
将 对 象 标志 为 包含 或 不 包含 所 有 声明 为 .SAFESEH 的 异常 处 理 程序 。( 32 位 汇编 语言 中 ， 


该 项 设置 为 NO。) ml64.exe 中 不 可 用 


在 列表 文件 中 添加 第 一 次 编译 后 的 列表 
按 每 行 字符 数 设 置 源 列 表 文 件 的 行 宽 。 范 围 为 60 ~ 255， 或 0。 默认 值 为 0。 同 PAGE 


width 


生成 列表 文件 时 关闭 符号 表 
按 每 页 行 数 设置 源 列 表 文 件 的 页 面 长度 。 范 围 为 10 ~ 255, 或 0。 默 认 值 为 0。 同 PAGE 


length 


为 源 列表 文件 指定 文本 。 同 SUBTITLE text 

为 源 列表 文件 指定 标题 。 同 TITLE text 

打开 列表 文件 中 为 false 的 条 件 句 

汇编 扩展 名 不 为 .ASM 的 源 文 件 

同 /W0 

设置 警告 级 别 ， 其 中 Level-=0、1、2 或 3 

若 产生 警告 ， 则 返回 错误 码 

忽略 INCLUDE 环境 路 径 

在 目标 文件 中 生成 行 号 信息 

使 所 有 符号 都 成 为 公共 的 (public) 

在 目标 文件 中 生成 CodeView 信息 ( 仅 16 位 编程 ) 
启用 M510 选项 ， 使 能 与 MASM 5.1 最 大 程度 的 兼容 
将 结构 对 齐 到 指定 的 字 节 边界 。alignment 可 以 为 1、2 或 4 
只 执行 语法 检查 

显示 ML 命令 行 语法 帮助 信息 


A.5 ”Microsoft 汇编 器 伪 指 令 


name=expression 


将 expression 的 数值 分 配给 name。 之 后 符号 可 以 重 定义 。 
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.386 
允许 汇编 80386 处 理 器 的 非特 权 指令 ， 禁 止 汇编 其 后 处 理 器 引入 的 指令 。 也 允许 汇编 
80387 指令 。 
.386P 
允许 汇编 80386 处 理 器 的 全 部 指令 ( 含 特权 指令 )， 禁 止 汇 编 其 后 处 理 器 引信 的 指令 。 
也 允许 汇编 80387 指令 。 
.387 
允许 汇编 80378 协 处 理 器 的 全 部 指令 . 
.486 
允许 汇编 80486 处 理 器 的 非特 权 指 令 。 
.486P 
允许 汇编 80486 处 理 器 的 全 部 指令 ( 含 特权 指令 )。 
.586 
允许 汇编 Pentium 处 理 器 的 非特 权 指 令 。 
.586P 
允许 汇编 Pentium 处 理 器 的 全 部 指令 ( 含 特权 指令 )。 
.686 
允许 汇编 Pentium Pro 处 理 器 的 非特 权 指令 。 
.686P 
允许 汇编 Pentium Pro 处 理 器 的 全 部 指令 ( 含 特权 指令 ) 。 
.8086 
允许 汇编 8086 指令 (和 相同 的 8088 指令 )， 禁 止 汇编 其 后 处 理 器 引入 的 指令 。 人 允许 汇 
编 8087 指令 。 此 为 处 理 器 默认 模式 。 
.8087 
允许 汇编 8087 指令 ， 禁 止 汇编 其 后 协 处 理 器 引入 的 指令 。 此 为 协 处 理 器 默认 模式 。 
ALIAS <alias>=<actual-name> 
将 旧 文 件 名 映射 为 新 文件 名 。Alias 为 备 选 名 或 别名 ，actual-name 是 函数 或 过 程 的 实际 
名 称 。 尖 括号 是 必需 的 。ALIAS 伪 指令 可 用 于 创建 允许 链接 器 (LINK) 将 旧 函 数 映射 
为 新 函数 的 链接 库 。 
ALIGN [[number]] 
将 下 一 个 变量 或 指令 以 number 为 倍数 对 齐 到 字 节 边界 。 
-ALPHA 
按 字母 顺序 对 段 排序 。 


ASSUME segregister:name ||, segregister:name)... 
ASSUME dataregister:type ||, dataregister:typel... 
ASSUME register:ERROR |[|, register:ERROR]... 
ASSUME llregister:l| NOTHING ||, register:NOTHING... 


允许 对 寄存 器 值 进行 错误 检查 。 一 个 ASSUME 生效 后 ， 汇 编 器 监控 给 定 寄存 器 值 的 变 
化 。 若 寄存 器 被 使 用 ， 则 ERROR 生成 错误 。NOTHING 取消 寄存 器 错误 检查 。 一 条 语 
句 中 可 使 用 不 同 的 假设 组 合 。 
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.BREAK [[.IF condition|] 
若 condition 为 真 ， 则 生成 代码 终止 .WHILE 或 .REPEAT 语句 块 。 
[lname] BYTE initializer |[, initializer]] ... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 一 个 字 节 。 也 可 用 作 任 何 合法 类 型 
的 类 型 说 明 符 。 
name CATSTR lltextiteml ll, textfitem2]... |] 
连接 文本 项 。 每 个 文本 项 都 可 以 是 字符 串 、 前 级 为 % 的 常数 或 者 宏 函 数 返 回 的 字符 串 。 
.CODE [[name]] 
与 .MODEL 一 起 使 用 时 ， 表 示 以 name 为 名 代码 段 的 开始 (对 微 模式 、 小 模式 、 紧 凑 模 
式 和 平坦 模式 ， 默 认 段 名 为 TEXT; 对 其 他 模式 ， 默 认 段 名 为 module_TEXT)。 
COMM definition [[, definition]]... 
用 definition 指定 的 属性 创建 公共 变量 。 每 个 definition 的 形式 如 下 : 
langtypel |NEAR | FAR | label:typell :count)|| 
label 为 变量 名 。type 为 任意 类 型 说 明 符 ( BYTE、WORD 等 等 ),， 或 者 指定 字 节 个 数 的 
整数 。count 指定 数据 对 象 的 个 数 (默认 值 为 1 )。 
COMMENT delimiter ||text |] 
ltext|, 


lltext | delimiter |text | 


把 分 隔 符 之 间 以 及 与 分 隔 符 同一 行 的 text 当 作 一 个 注释 。 
.CONST 


与 .MODEL 一 起 使 用 时 ， 表 示 开 始 一 个 常量 数据 段 ( 段 名 为 CONST)。 该 段 为 只 读 
属性 。 


.CONTINUE [.IF condition]) 


若 condition 为 真 ， 则 生成 代码 跳 转 到 .WHILE 或 .REPEAT 代码 块 的 项 部。 
.CREF 


允许 列 出 符号 表 和 浏览 器 文件 内 符号 部 分 的 符号 。 
.DATA 


与 .MODEL 一 起 使 用 时 ， 表 示 开 始 一 个 已 初始 化 的 近 数 据 段 ( 段 名 为 _DATA )。 
.DATA? 


与 .MODEL 一 起 使 用 时 ， 表 示 开 始 一 个 未 初始 化 的 近 数 据 段 ( 段 名 为 _BSS )。 
.DOSSEG 

按照 MS-DOS 段 规范 对 段 进行 排序 : CODE 排 第 一 ， 其 后 为 非 DGROUP 的 段 ， 然 后 为 

DGROUP 的 段 。 属 于 DGROUP 的 段 顺序 为 : 非 BSS 或 STACK 的 段 ， 其 后 为 BSS 段 ， 

最 后 为 STACK 段 。 主 要 用 于 确保 MASM 支持 的 CodeView 独立 于 程序 。 同 DOSSEG。 
DOSSEG 

与 .DOSSEG 相同 ， 为 首选 形式 。 
DB 

用 于 定义 BYTE 类 型 数据 。 
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DD 

用 于 定义 DWORD 类 型 数据 。 
DF 

用 于 定义 FWORD 类 型 数据 。 
DQ 

用 于 定义 QWORD 类 型 数据 。 
DT 

用 于 定义 TBYTE 类 型 数据 。 
DW 

用 于 定义 WORD 类 型 数据 。 


[name] DWORD initializer [|, initializer]. .. 


为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 一 个 双 字 (4 字 节 )。 也 可 用 作 任 何 
合法 类 型 的 类 型 说 明 符 。 
ECHO message 
在 标准 输出 设备 (默认 为 屏幕 ) 上 显示 message。 同 %OUT。 
.ELSE 
参见 .IF。 
ELSE 
标记 条 件 代码 块 内 备 选 块 的 开始 。 参 见 I 下。 
ELSEIF 
把 ELSE 和 1IFf 组 合 为 一 条 语句 。 参 见 IF。 
ELSEIF2 
若 OPTION: SETIF2 为 TRUE ， 则 每 次 汇编 时 都 计算 ELSEIF 代码 块 。 
END [[address]] 
标识 模块 结束 ， 可 选 的 可 以 将 程序 人 口 设 置 为 address。 
.ENDIF 
参见 .IF。 
ENDIF 
参见 IF。 
ENDM 
终止 宏 或 重复 块 。 参 见 MACRO 、FOR、FORC、REPEAT 、WHILE。 
name ENDP 
标志 过 程 name 的 结束 ， 该 过 程 之 前 由 PROC 开始 。 参 见 PROC。 
name ENDS 
标志 名 为 name 的 段 、 结 构 或 联合 的 结束 ， 其 之 前 由 SEGMENT、STRUCT、UNION 或 
简化 的 段 伪 指令 开始 。 
.ENDW 
参见 .WHILE。 
name EQU expression 


将 expression 的 数值 分 配给 name。name 在 之 后 不 可 以 重 定义 。 
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name EQU <text> 
将 指定 text 分 配给 name。name 在 之 后 可 以 重新 分 配 不 同 的 text。 参 见 TEXTEQU。 
-ERR [[messagel] 
产生 错误 。 
.ERR2 [[messagel] 
若 OPTION: SETIF2 为 TRUE， 则 每 次 汇编 时 都 计算 .ERR 代码 块 。 
.ERRB <textitem> [[, messagel] 
若 textitem 为 空 ， 则 产生 错误 。 
.ERRDEF name [[, miessage]] 
若 name 为 前 面 已 定义 的 标号 、 变 量 或 符号 ， 则 产生 错误 。 
.ERRDIF [[I1]] <textitem1>, <textitem2> [[, messagel] 
若 文本 项 不 同 ， 则 产生 错误 。 若 给 定 1， 则 比较 操作 忽略 大 小 写 。 
.ERRE expression [[, message]] 
若 expression 为 假 (0 )， 则 产生 错误 。 
.ERRIDN [[1]] <textitem1>, <textitem2> [[, message]] 
若 文本 项 相同 ， 则 产生 错误 。 若 给 定 I， 则 比较 操作 忽略 大 小 写 。 
.ERRNB <textitem> [[, message]] 
若 textitem 为 非 空 ， 则 产生 错误 。 
.ERRNDEF name [[, message]] 
若 name 还 未 定义 ， 则 产生 错误 。 
.ERRNZ expression [[, messagel|] 
车 expression 为 真 ( 非 0 )， 则 产生 错误 。 
EVEN 
将 下 一 个 变量 或 指令 对 齐 到 偶数 字 节 边界 。 
.EXIT [[expression]] 
生成 终止 代码 。 向 shell 返回 可 选 的 expression。 
EXIT™ [[textitem]|] 
终止 扩展 当前 的 重复 或 宏 代码 块 ， 开 始 汇编 该 块 之 外 的 下 一 条 语句 。 在 宏 函 数 中 ， 
textitem 是 返回 值 。 


‘EXTERN lllangtypel] name [[(altid)] :type [l, lllangtypell name [[(altid)| :typel... 


定义 一 个 或 多 个 外 部 变量 、 标 号 或 符号 ， 其 名 称 为 name， 类 型 为 type。type 可 以 为 
ABS， 其 输入 name 为 常数 。 同 EXTRN。 


EXTERNDEF [Lenrgtype] name:type [Tiargtypel name:typel. .. 


定义 一 个 或 多 个 外 部 变量 、 标 号 或 符号 ， 其 名 称 为 name， 类 型 为 type。 若 name 在 模块 

中 定义 ， 则 将 其 属性 当 作 PUBLIC。 若 name 在 模块 中 被 引用 ， 则 将 其 当 作 EXTERN。 若 

name 未 被 引用 ， 则 忽略 它 。type 可 以 为 ABS， 其 输入 name 为 常数 。 通 常用 于 头 文件 。 
EXTRN 

参见 EXTERN。 
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.FARDATA [[namell] 
与 .MODEL 一 起 使 用 时 ， 表 示 开 始 一 个 已 初始 化 的 远 数据 段 ( 段 名 为 FAR_DATA 或 
name ) 。 

.FARDATA? [[name]] 
与 .MODEL 一 起 使 用 时 ， 表 示 开 始 一 个 未 初始 化 的 远 数 据 段 ( 段 名 为 FAR_ BSS 或 


name)。 


FOR parameter | :REQ | :=default|, <argument | ,argumentl. . .> 


标志 一 个 代码 块 ， 该 块 对 每 个 argument 都 要 重复 一 次 ， 每 次 重复 时 用 当前 argument 替 
换 parameter。 同 IRP。 
FORC 
parameter, <string> statementls 
ENDM 
标志 一 个 代码 块 ， 该 块 对 string 中 的 每 个 字符 都 要 重复 一 次 ， 每 次 重复 时 用 当前 字符 替 
换 Parameter。 同 IRPC。 
[name] FWORD initializer |[, initializer]. .. 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 6 个 字 节 。 也 可 用 作 任 何 合法 类 型 
的 类 型 说 明 符 。 
GOTO macrolabel 
将 汇编 转 到 标记 为 :macrolabel 的 代码 行 。GOTO 只 允许 出 现在 MACRO、FOR、 
FORC、REPEAT 和 WHILE 块 内 。 标 号 是 该 行 唯一 的 伪 指 令 ， 且 其 前 面 必须 有 冒号 。 
name GROUP segment [[, segment]]... 、 
向 name 组 添加 指定 segments。 本 条 伪 指 令 在 32 位 平坦 模式 编程 中 不 起 作用 ， 如 果 和 / 
co 任命 令 行 选项 一 起 使 用 则 发 生 错 误 。 
.IF condition] 


statements 
[.ELSEIF condition2 
Statemenis|| 
lL.ELSE 
statements|| 
-ENDIF 


生成 代码 测试 condition1 (比如 AX > 7)， 若 条 件 为 真 ， 则 执行 statement。 若 其 后 跟 
有 .ELSE， 则 初始 条 件 为 假 时 ， 执 行 其 语句 。 注 意 ， 条 件 在 运行 时 计算 。 


IF expression1 
ifstatements 
[ELSEIF expression2 

elseifstatements | 
IELSE 

elsestatements | 
ENDIF 


车 expression1 为 真 ( 非 0)， 汇 编 访 tatements ; 若 expression1 为 假 (0 ) 且 expression2 为 
真 ， 则 汇编 elseifstatement。 下 面 的 伪 指 令 可 以 蔡 代 ELSEIF : ELSEIFB、ELSEIFDEF、 
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ELSEIFDIF、 ELSEIFDIFI、 ELSEIFE、 ELSEIFIDN、 ELSEIFIDNI、ELSEIFNB 和 
ELSEIFNDEF。 作 为 备 选 ， 若 前 述 条 件 均 为 假 ， 则 汇编 elsestatements。 注 意 ， 条 件 在 
运行 时 计算 。 
IF2 expression 
车 OPTION: SETIF2 为 TRUE， 则 每 次 汇编 时 都 计算 IF 代码 块 。 完 整 语法 参见 IF 。 
IFB textitem 
若 testitem 为 空 ， 则 汇编 。 完 整 语法 参见 IF。 
IFDEF name 
若 name 是 已 定义 标号 、 变 量 或 符号 ， 则 汇编 。 完 整 语法 参见 IF。 
IFDIF [[1]] textitem1, textitem2 
若 文本 项 不 同 ， 则 汇编 。 如 果 给 定 1， 则 比较 操作 忽略 大 小 写 。 完 整 语 法 参见 IF。 
IFE expression 
车 expression 为 假 (0 )， 则 汇编 。 完 整 语 法 参见 下 。 
IFIDN [[1]], textitem1, textitem2 
若 文本 项 相同 ， 则 汇编 。 如 果 给 定 1， 则 比较 操作 忽略 大 小 写 。 完 整 语 法 参见 IF。 
IFNB textitem 
若 textitem 非 空 ， 则 汇编 。 完 整 语法 参见 IF。 
IFNDEF name 
若 name 未 定义 ， 则 汇编 。 完 整 语法 参见 下 。 
INCLUDE filename 
汇编 时 ， 把 指定 源 文件 filename 中 的 源 代码 插入 到 当前 源 文件 中 。 若 filename 包含 了 反 
斜 杠 、 分 号 、 大 于 号 、 小 于 号 、 单 引号 或 双 引 号 ， 那 么 该 项 需 用 尖 插 号 括 起 。 
INCLUDELIB libraryname 
通知 链接 器 当前 模块 与 libraryname 链接 。 若 libraryname 包含 了 反 斜 枉 、 分 号 、 大 于 
号 、 小 于 号 、 单 引号 或 双 引 号 ， 那 么 该 项 需 用 尖 括 号 括 起 。 
name INSTR [[position,|] textitem1, textitem2 
在 textitem1 中 找到 第 一 次 出 现 的 textitem2。 开 始 的 position 为 可 选 。 每 个 文本 项 都 可 以 
是 字符 串 、 前 级 为 % 的 常数 或 者 宏 函 数 返回 的 字符 串 。 
INVOKE expressiom[[, arguments]] 
调用 过 程 ， 其 地 址 由 expression 给 出 ， 按 照 语言 类 型 的 标准 调用 规范 用 堆栈 或 寄存 器 
传递 参数 。 向 过 程 传递 的 每 一 个 参数 可 以 为 表达 式 、 寄 存 器 对 或 地 址 表达 式 (前 缀 为 
ADDR 的 表达 式 )。 
IRP 
参见 FOR。 
IRPC 
参见 FORC。 
name LABLE type 
创建 一 个 新 标号 ， 名 称 为 name， 类 型 为 ype， 并 将 当前 地 址 计数 器 的 值 分 配给 它 。 
name LABEL [[INEARIFAR|IPROCI]] PTR [[typel]] 
创建 一 个 新 标号 ， 名 称 为 aame， 类 型 为 ype， 并 将 当前 地 址 计数 器 的 值 分 配给 它 。 
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.K3D 
允许 汇编 K3D 指令 。 
.LALL 
参见 .LISTMACROALL。 
.LFCOND 
参见 .LISTIF。 
.LIST 
启动 语句 列表 。 本 伪 指 令 是 默认 的 。 
.LISTALL 
启动 所 有 语句 列表 。 等 价 于 .LIST、.LISTIF 和 .LISTMACROALL 的 组 合 。 
.LISTIF 
启动 假 条 件 代码 块 内 的 语句 列表 。 同 .LFCOND。 
.LISTMACRO 
启动 生成 代码 或 数据 的 宏 扩 展 语 句 列表 。 本 伪 指 令 为 默认 。 同 .XALL。 
.LISTMACROALL 
启动 宏 内 所 有 语句 的 列表 。 同 .LALL。 
LOCAL localnamell, iocainame]l]... 
在 宏 内 ，LOCAL 定义 了 每 个 宏 实例 唯一 的 标号 。 


LOCAL label || [count ] ll ll:typell ll, label || [count] | lltypelll... 


在 过 程 定义 (PROC) 中 ，LOCAL 创建 堆栈 变量 ， 该 变量 存在 于 过 程 持续 期 间 。/abel 
可 以 是 简单 变量 ， 或 含有 count 个 元 素 的 数组 。 
name MACRO ||parameter | :REQ | :=defautt1:VARARG 川 . . 


Statements 
ENDM ll valuel 


标记 名 称 为 name 的 宏 ， 并 为 宏 调用 时 需 传递 的 实 参 建立 parameter 占 位 符 。 宏 函数 向 
主 调 语 句 返 回 value。 

.MMX 
允许 汇编 MMX 指令 。 

.MODEL memorymodel ||, langtypel ll, stackoption || 


初始 化 程序 内 存 模式 。memorymodel 可 以 为 TINY、SMALL、COMPACT、MEDIUM、 
LARGE、HUGE 或 FLAT。 langtype 可 以 为 C、BASIC、FORTRAN、PASCAL、SYSCALL 
或 STDCALL。stackoption 可 以 为 NEARSTACK 或 FARSTACK。 

NAME modulename 
忽略 。 

.NO87 
禁止 汇编 所 有 浮 点 指令 。 

.NOCREF [[rname [[, name]l]...]] 
禁止 符号 表 和 浏览 器 文件 的 符号 列表 。 若 指定 名 称 ， 则 仅 禁止 给 定名 。 同 .XCREF。 
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.NOLIST 
禁止 程序 列表 。 同 .XLIST。 

.NOLISTIF 
禁止 列 出 条 件 计算 为 假 (0 ) 的 条 件 块 。 本 伪 指 令 为 默认 。 同 .SFCOND。 

-NOLISTMACRO 
禁止 宏 扩展 列表 。 同 .SALL。 

OPTION optionlist 
允许 和 禁止 汇编 器 特性 。 可 用 选项 包括 CASEMAP、DOTNAME 、NODOTNAME、 
EMULATOR 、NOEULATOR 、EPILOGUE 、EXPR16、EXPR32、LANGUAGE、 
LJMP 、NOLJMP 、M510、NOM510、NOKEYWORD 、NOSIGNEXTEND 、OFFSET、 
OLDMACROS 、NOOLDMACROS 、OLDSTRUCTS 、NOOLDSTRUCTS 、PROC 、 
PROLOGUE 、READONLY 、NOREADONLY 、SCOPED 、NOSCOPED 、SEGMENT 和 
SETIF2。 

ORG expression 
将 地 址 计数 器 设置 为 expression。 

%OUT 
参见 ECHO。 

[[name]] OWORD initializer [[, initializer]]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 一 个 八字 ( 16 个 字 节 )。 也 可 用 作 任 
何 合 法 类 型 的 类 型 说 明 符 。 该 数据 类 型 主要 用 于 流 媒体 SIMD 指令 ， 它 是 一 个 包含 了 四 
个 4 字 节 实数 的 数组 。 

PAGE [[[[liength]], width]] 
将 程序 列表 的 行 长 度 设 置 为 length， 字 符 宽度 设置 为 width。 若 未 给 出 实 参 ， 则 生成 一 
个 分 页 符 。 

PAGE+ 
节 编 号 递增 ， 页 号 重 置 为 1。 

POPCONTEXT context 
恢复 部 分 或 全 部 当前 context (由 PUSHCONTEXT 伪 指令 保存 )。context 可 以 为 
ASSUME、RADIX、LISTING、CPU 或 ALL。 

label PROC ||distancell lllangtypel lvisibility | ll <prologuearg>|| 

IIUSES reglist| ll, parameter || :tag |]. .. 


Statements 
label ENDP 


标记 过 程 块 label 的 开始 和 结束 。 块 内 语句 可 由 CALL 指令 或 INVOKE 伪 指令 调用 。 
label PROTO [ldistancel [langtypel ll, [parameter ll:tag ll. .. 

定义 函数 原型 。 
PUBLIC [langtype]| name [, lllangtype |] mamzel. 

使 每 个 用 name 指定 的 变量 、 标 号 或 绝对 符号 能 够 被 程序 中 所 有 其 他 模块 使 用 。 


PURGE macroname [[, macronamel]]... 


从 内 存 中 删除 指定 宏 。 
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PUSHCONTEXT context 
保存 部 分 或 全 部 当前 context: 段 与 寄存 器 的 对 应 假设 、 基 数值 、 列 表 与 互 参 ( cref) 标志 、 
处 理 器 / 协 处 理 器 值 。context 可 以 为 ASSUMES 、RADIX、LISTING、CPU 或 ALL。 
[[name]l] QWORD initializerll, iniftializer|]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 8 个 字 节 。 也 可 用 作 任 何 合法 类 型 
的 类 型 说 明 符 。 
.RADIX expression 
将 默认 基数 设置 为 expression 的 值 ， 范 围 为 2 一 16。 
name REAL4 initializer|l, initializer]]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 一 个 单 精度 (4 字 节 ) 浮 点 数 。 
name REALS initializer[l, initializer]]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 一 个 双 精 度 ( 8 字 节 ) 浮 点 数 。 
name REAL10 initializer[[, initializer]]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 一 个 10 字 节 的 浮 点 数 。 
recordname RECORD fieldname:width ||= expression | 
[ll, fieldname:widith ||= expression | .. 
声明 含有 指定 字段 的 记录 类 型 。fieldname 为 字段 名 ，width 指定 位 数 ，expression 为 字 
段 初始 值 。 
.REPEAT 
statements 
:UNTIL condition 
生成 代码 重复 执行 statement 块 ， 直 到 condition 变 为 真 。.UNTIL 可 以 被 .UNTILCXZ 代 
替 ， 其 意 为 阁 CX 为 0， 则 为 真 。 如 果 使 用 .UNTILCXZ， 则 condition 可 选 。 


REPEAT expression 
Statements 
ENDM 


标志 代码 块 ， 重 复 执行 expression 次 。 同 REPT。 
REPT 
参见 REPEAT。 
.SALL 
参见 .NOLISTMACRO， 
name SBYTE initializer[l, initializer]]... 
为 每 个 initializer 分 配 存储 空间 的 1 个 字 节 并 初始 化 (可 选 ) 为 有 符号 数 。 也 可 用 作 任 
何 合法 类 型 的 类 型 说 明 符 。 
name SDWORD initializer[[, initializer]]... 
为 每 个 initializer 分 配 存 储 空间 的 1 个 双 字 (4 字 节 ) 并 初始 化 (可 选 ) 为 有 符号 数 。 也 
可 用 作 任 何 合 法 类 型 的 类 型 说 明 符 。 


name SEGMENT | READONLY | |lalign | |combinei lusel li ‘class’|| 
statements 
name ENDS 


定义 程序 段 ， 段 名 为 name， 段 属性 有 align (BYTE、WORD、DWORD、PARA、PAGE), 
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combine (PUBLIC STACK、 COMMON、 MEMORY 、AT address, PRIVATE,), use (USE16、 
USE32、FLAT)， 以 及 class。 
.SEQ 
对 段 进行 排序 ( 按 默认 顺序 )。 
.SFCOND 
参见 .NOLISTIF。 
name SIZESTR textitem 
查找 文本 项 的 大 小 。 
‘STACK [[size]] 
与 .MODEL 一 起 使 用 时 ， 定 义 一 个 堆栈 段 ( 段 名 为 STACK)。 选 项 size 指定 堆栈 的 字 
节 数 (默认 为 1024 )。.STACK 伪 指 令 自动 关闭 堆栈 语句 。 
.STARTUP 
生成 程序 启动 代码 。 
STRUC 
参见 STRUCT。 
name STRUCT llalignment| |, NONUNIQUE! 
fielddeclarations 
name ENDS 
声明 含有 指定 fielddeclaration 的 结构 类 型 。 每 个 字段 都 必须 有 有 效 的 数据 定义 。 同 
STRUC。 


name SUBSTR textitem, position ||, length | 


返回 textitem 的 子 串 ， 起 始 位 置 为 position。textitem 可 以 为 字符 串 、 前 级 为 % 的 常数 ， 
或 宏 函 数 的 返回 串 。 
SUBTITLE text 
定义 列表 的 子 标题 。 同 SUBTTL。 
SUBTTL 
参见 SUBTITLE。 
name SWORD imifializer[[, initializer]]... 
为 每 个 initializer 分 配 存储 空间 的 1 个 字 (2 字 节 ) 并 初始 化 (可 选 ) 为 有 符号 数 。 也 可 
用 作 任 何 合 法 类 型 的 类 型 说 明 符 。 
name TBYTE initializerll, initializer]]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 10 个 字 节 。 也 可 用 作 任 何 合 法 类 型 
的 类 型 说 明 符 。 
name TEXTEQU [[iextitem]] 
将 textitem 赋值 给 name。 textitem 可 以 为 字符 串 ， 前 缀 为 % 的 常数 ， 或 宏 函 数 的 返回 串 。 
.TFCOND 
切换 到 假 条 件 代码 块 列表 。 
TITLE text 
定义 程序 列表 标题 。 
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name TYPEDEKF type 
定义 与 ype 等 价 的 新 类 型 ， 其 名 称 为 name。 
name UNION llalignment|||, NONUNIQUE) 
fielddeclarations 
name|ll ENDS 
声明 有 一 个 或 多 个 数据 类 型 的 联合 .fielddeclaration 必须 为 有 效 数 据 定义 。 对 髓 套 
UNION 定义 ， 则 忽略 ENDS name 标号 。 
.UNTIL 
参见 .REPEAT。 
:UNTILCXZ 
参见 .REPEAT。 
.WHILE condition 
statemenits 
:ENDW 
当 condition 为 真 时 ， 生 成 代码 执行 statement 块 。 
WHILE expression 
statements 
ENDM 
只 要 expression 为 真 ， 则 重复 汇编 statement 块 。 
[[name]] WORD initializerll, initializer|]... 
为 每 个 initializer 分 配 并 初始 化 (可 选 ) 存储 空间 的 1 个 字 (2 字 节 )。 也 可 用 作 任 何 合 
法 类 型 的 类 型 说 明 符 。 
.XALL 
参见 .LISTMACRO。 
.XCREF 
参见 .NOCREF . 
.XLIST 
参见 .NOLIST-。 
.XMM 
允许 汇编 Internet 流 媒 体 SIMD 扩展 指令 。 


A.6 符号 


$ 
地 址 计数 器 的 当前 值 。 


数据 定义 中 ， 该 符号 表示 汇编 器 分 配 一 个 数值 ， 但 不 进行 初始 化 。 
@@: 
定义 了 只 在 labell 和 [label2 之 间 的 一 个 可 识别 代码 标号 ， 其 中 labell 为 代码 开端 ， 或 

前 一 个 @@: 标号 ，labeL?2 为 代码 结束 ,或 下 一 个 @@: 标号 。 参 见 @B 和 @F。 
@B 

前 一 个 @@: 标号 的 地 址 。 
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@CatStr (string]I[l, string2...]]) 
连接 一 个 或 多 个 字符 串 的 宏 函 数 。 返 回 一 个 串 。 
@code 
代码 段 名 称 (文本 宏 )。 
@CodeSize 
0 代表 TINY、SMALL、COMPACT 和 FLAT 模式 ; 1 代表 MEDIUM、LARGE 和 HUGE 
模式 (以 等 价 数 值 表示 ) 。 
@Cpu 
位 屏蔽 指定 处 理 器 模式 的 位 掩 码 (以 等 价 数值 表示 )。 
@CurSeg 
当前 段 名 称 (文本 宏 )。 
@data 
默认 数据 组 名 称 。 对 除 FLAT 外 的 所 有 模式 ， 其 值 为 DGROUP。 对 FLAT 内 存 模 式 ， 
其 值 为 FLAT (文本 宏 )。 
@DataSize 
0 代表 TINY、SMALL、MEDIUM 和 FLAT 模式 ，1 代表 COMPACT 和 LARGE 模式 ， 
2 代表 HUGE 模式 (以 等 价 数值 表示 ) 。 
@Date 
格式 为 mm/dd/yy 的 系统 日 期 (文本 宏 )。 
@Environ(envvar) 
环境 变量 envvar 的 值 ( 宏 函 数 )。 
@F 
下 一 个 @@: 标号 的 地 址 。 
@fardata 
段 名 称 ， 该 段 由 .FARDATA 伪 指 令 定 义 (文本 宏 )。 
@fardata? 
段 名 称 ， 该 段 由 .FARDATA ? 伪 指 令 定义 (文本 宏 )。 
@FileCur 
当前 文件 名 (文本 宏 )。 
@FileName 
汇编 主 文件 的 基本 名 (文本 宏 )。 
@InSstr([[position]] , stringl, string2) 
宏 函 数 ， 其 功能 为 在 string1l 中 找到 第 一 个 与 string2 相同 的 串 ，stringl 中 的 起 始 位 置 为 
position。 若 没有 position 项 ， 则 对 string1 从 头 开始 搜索 。 返 回 位 置 值 ， 如 果 没 有 发 现 
string2， 则 返回 0。 
@lInterface 
语言 参数 信息 (以 等 价 数 值 表示 )。 
@Line 
当前 文件 中 的 源 代码 行 号 (以 等 价 数 值 表示 )。 
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@Model 


1 代表 TINY 模式 ,2 代表 SMALL 模式 ,3 代表 COMPACT 模式 ,4 代表 MEDIUM 模式 ， 
5 代表 LARGE 模式 ，6 代表 HUGE 模式 ，7 代表 FLAT 模式 (以 等 价 数值 表示 )。 
@SizeStr (string) 
返回 给 定 字符 串 长 度 的 宏 函 数 。 返 回 值 为 整数 。 
@stack 
对 近 堆 栈 ， 为 DGROUP; 对 远 堆栈 ,为 STACK (文本 宏 )。 
@SubStr (string, position[l[, length]]) 
宏 函 数 ， 返 回 从 position 开始 的 子 串 。 


@Time 

24 小 时 hh: mm: ss 格式 的 系统 时 间 (文本 宏 )。 
@Version 

610 表示 MASM 6.1 (文本 宏 )。 
@WordSize 

2 表示 16 位 段 ，4 表示 32 位 段 (以 等 价 数值 表示 )。 
A.7 ”运算 符 


expressionlt+expression2 

返回 expressionl 加 expression2。 
expressionl-expression2 

返回 expression1 减 expression2。 
expressionl*expression2 

返回 expression1l 乘 以 expression2。 
expressionl/expression2 

返回 expression] 除 以 expression2。 
-expression 

expression 符号 取 反 。 
expression] [expression2] 

返回 expressionT 加 [expression2]。 
segment: expression 

用 segment 覆盖 expression 的 默认 段 。segment 可 以 为 段 寄存 器 、 组 名 、 段 名 或 段 表达 

式 。expression 必须 为 常量 。 
expression. field [|.field]]... 

返回 expression 加 上 其 结构 或 联合 内 field 的 偏 移 量 。 
[registerl|.field [[.fieldll]... 

返回 位 于 register 加 上 其 在 结构 或 联合 内 field 的 偏 移 量 位 置 处 的 值 。 
<text> 

将 text 当 作 单 个 文本 元 素 。 
“text” 


将 “text” 当 作 一 个 字符 串 。 
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‘text’ 
将 “text” 当 作 一 个 字符 串 。 
lcharacter 
将 character 当 作文 本 字符 ， 而 非 运 算 符 或 符号 。 
;text 
将 text 当 作 注释 。 
;sfext 


将 text 当 作 宏 注释 ， 且 仅 出 现在 宏 定义 中 。 宏 展开 时 ， 列 表 不 会 显示 text。 
%expression 

将 宏 实 参 中 expression 的 值 当 作文 本 。 
&parameter& 

用 对 应 实 参 值 代替 parameter。 
ABS 

参见 EXTERNDEF 伪 指 令 。 
ADDR 

参见 INVOKE 伪 指 令 。 
expression1 AND expression2 

返回 expression1 和 expression2 按 位 AND 运算 的 结果 。 
count DUP (initialvalue [[, intialvalue]]...) 

指定 initialvalue 声明 的 个 数 为 count。 
expressionl1 EQ expression2 

若 expression1 等 于 expression2， 则 返回 真 (一 1 ); 否则 返回 假 (0 )。 
expressionl GE expression2 

若 expressionl 大 于 或 等 于 expression2， 则 返回 真 (-1 ); 否则 返回 假 (0 )。 
expressionl GT expression2 

车 expressionl 大 于 expression2， 则 返回 真 (-1 ); 否则 返回 假 (0 )。 
HIGH expression 

返回 expression 的 高 字 节 。 
HIGHWORD expression 

返回 expression 的 高 字 。 
expressi0111 LE expression2 

若 expression1 小 于 或 等 于 expression2， 则 返回 真 (-1 ); 否则 返回 假 (0 )。 
LENGTH variable 

返回 第 一 个 初始 化 函数 创建 的 variable 中 数据 项 的 个 数 。 
LENGTHOFR variable 

返回 variable 中 数据 对 象 的 个 数 。 
LOW expression 

返回 expression 的 低 字 节 。 
LOWWORD expression 

返回 expression 的 低 字 。 
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LROFFSET expression 
返回 expression 的 偏 移 量 。 与 OFFSET 相同 , 但 是 本 运算 符 会 生成 加 载 器 解析 的 偏 移 
量 ， 这 使 得 Windows 可 以 重 定位 代码 段 。 
exXpressioFi1 LT expression2 
若 expression7 小 于 expression2， 则 返回 真 (-1); 否则 返回 假 (0 )。 
MASK {recordfieldnamel|lrecord} 
返回 位 掩 码 ， 其 中 recordfieldname 或 record 中 的 位 置 1， 其 他 位 清 零 。 
expression1 MOD expression2 
返回 整数 值 ， 该 值 为 expressionl 除 以 expression2 的 余数 ( 取 模 )。 
expressionl NE expression2 
若 expression1 不 等 于 expression2， 则 返回 真 (-1 ); 否则 返回 假 (0 )。 
NOT expression 
返回 expression 按 位 取 反 的 结果 。 
OFFSET expression 
返回 expression 的 偏 移 量 。 
OPATTR expression 
返回 一 个 字 ， 定 义 expression 的 模式 和 范围 。 其 低 字 节 等 于 .TYPE 返回 的 字 节 ， 高 字 节 
包含 了 其 他 信息 。 
expression] OR expression2 
返回 expression1 和 expression2 按 位 OR 运算 的 结果 。 
type PTR expression 
强制 expression 转 为 指定 type。 
[[distance]] PTR type 
指定 type 指针 。 
SEG expression 
返回 expression 的 段 。 
expression SHL count 
返回 expression 左 移 count 位 后 的 结果 
SHORT label 
将 label 设置 为 短 类 型 。 所 有 到 label 的 跳 转 都 必须 为 短 跳 转 〈 跳 转 指 令 到 label 的 距离 
范围 为 -128 一 +127 字 节 )。 
expression SHR count 
返回 expression 右 移 count 位 后 的 结果 
SIZE variable 
返回 首次 初始 化 分 配给 variable 的 字 节 数 。 
SIZEOF {variableltype} 
返回 variable 或 type 的 字 节 数 。 
THIS type 
返回 指定 type 的 操作 数 ， 其 偏 移 量 和 段 值 与 当前 地 址 计数 值 相等 。 
.TYPE expression 
参见 OPATTR。 
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TYPE expression 
返回 expression 的 类 型 。 
WIDTH {recordfieldnamelrecord} 
以 位 为 单位 ， 返 回 当 前 recordfieldname 或 record 的 宽度 。 


expressionl1 XOR expression2 
返回 expressionl1 和 expression2 按 位 XOR 运算 的 结果 。 


A.8 运行 时 运算 符 
下 列 运算 符 仅 用 于 .IF，.WHILE 和 .REPEAT 块 ， 且 汇编 时 不 计算 ， 运 行 时 计算 : 


expression1==expression2 


等 于 。 
expressionl!=expression2 
不 等 于 。 
expressionl > expression2 
大 
expressionl > =expression2 
大 于 等 于 。 
expression] < expression2 
小 于 。 
expressionl 一 =expression2 
607 小 于 等 于 。 
expressionl||lexpression2 
逻辑 OR。 
expressionl&&expression2 
逻辑 AND。 
expressionl&expression2 
按 位 AND。 
lexpression 
逻辑 非 。 
CARRAY? 
进位 标志 位 的 状态 。 
OVERFLOW? 
溢出 标志 位 的 状态 。 
PARITY? 
奇偶 标志 位 的 状态 。 
SIGN? 
符号 标志 位 的 状态 。 
ZERO? 


零 标志 位 的 状态 。 
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B.1 引言 


本 附录 为 常用 32 位 x86 指令 的 快速 指南 。 其 中 不 涉及 系统 模式 指令 ， 以 及 仅 用 于 操作 
系统 核心 代码 或 保护 模式 设备 驱动 程序 的 典型 指令 。 


B.1.1 标志 位 (EFlags ) 


每 条 指令 说 明 中 都 用 一 组 方块 来 描述 该 指令 将 会 如 何 影响 CPU 状态 标志 。 每 个 标志 用 
一 个 字母 来 表示 : 


O 溢出 S 符号 P 奇偶 
D 方向 Z 零 C 进位 
I 中 断 A 辅助 进位 

每 个 方块 用 如 下 符号 来 表示 指令 对 标志 位 的 影响 : 

1 标志 位 置 1。 

0 标志 位 清 0。 

有 可 能 将 标志 位 变 为 一 个 不 确定 的 值 。 

( 空 ) 标志 位 不 变 。 

下 根据 与 标志 位 相关 的 特定 规则 来 改变 标志 位 。 


例如 ， 下 图 为 某 条 指令 说 明 中 的 CPU 标志 位 : 





由 上 图 可 知 : 溢出 标志 位 、 符 号 标志 位 、 零 标志 位 和 奇偶 标志 位 将 变 为 不 确定 值 ; 辅 
助 进位 标志 位 和 进位 标志 位 将 按照 与 标志 位 相关 的 规则 来 改变 ; 方向 标志 位 和 中 断 标志 位 
不 变 。 


B.1.2 ”指令 说 明 与 格式 


在 引用 源 和 目的 操作 数 时 ， 使 用 的 是 所 有 x86 指令 的 自然 操作 数 顺 序 ， 即 第 一 个 操作 
数 为 目的 操作 数 ， 第 二 个 为 源 操作 数 。 以 MOYV 指令 为 例 ， 该 指令 将 源 操作 数 复制 到 目的 操 
作 数 : 


MOV destination, source 


一 条 指令 可 能 有 多 种 格式 。 表 B-1 列 出 了 指令 格式 用 到 的 符号 。 在 单条 指令 的 说 明 中 ， 
符号 “x86” 表 示 指 令 或 其 某 个 变 体 仅 用 于 32 位 x86 家 族 的 处 理 器 ( Intel386 之 后 )。 同 样 ， 
符号 “( 80286 )” 表 示 至 少 需 用 Intel 80286 处 理 器 。 
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对 使 用 32 位 寄存 器 的 x86 处 理 器 和 使 用 16 位 寄存 器 的 所 有 早期 处 理 器 而 言 ， 寄 存 器 符 
号 , 如 (E) CX, (E) SI, (E) DI，(E) SP, (E) BP 和 (E) IP, 也 是 有 区 别 的 。 
表 B-1 指令 格式 中 的 符号 
符号 说 明 


8 位 、16 位 或 32 位 通用 寄存 器 : AH、AL、BH、 BL、 CH、 CL、 DH、 DL、 AX、BX、 


é CX DX. SI, DI BP. SP. EAX. EBX. ECX, EDX、 ESI、 EDI、 EBP 和 ESP 


reg8, regl6, reg32 用 位 数 标识 的 通用 寄存 器 
segreg 16 位 段 寄 存 器 (CS、DS、ES、SS、FS、GS) 
accum AL、AX 或 EAX 
mem 内 存 操作 数 ， 可 使 用 任何 标准 内 存 寻 址 模式 
mem8, mem16, mem32 用 位 数 标识 的 内 存 操作 数 
shortlabel 代码 段 中 的 位 置 ， 与 当前 位 置 的 距离 范围 为 -128 ~ +127 字 节 
nearlabel 当前 代码 段 中 的 位 置 ， 用 标号 表示 
farlabel 外 部 代码 段 中 的 位 置 ， 用 标号 表示 
imm 立即 操作 数 
imm8, imm]16, imm32 用 位 数 标 识 的 立即 操作 数 
instruction 80x86 汇编 语言 指令 


B.2 指令 集 详解 ( 非 浮 点 数 ) 
加 法 后 ASCII 调整 


X 风 I Ss > A 
Ce Le 


两 个 ASCII 数 相 加 后 ， 调 整 AL 中 的 结果 。 如 果 AL > 9， 则 AH 为 结果 的 高 位 数 ， 且 进位 标志 位 和 
辅助 进位 标志 位 置 1。 


O DD I S 2 
2 


EE 


92° 1 Ss a 
Eom 


两 个 非 压缩 BCD 数 相 乘 后 ， 调 整 AX 中 的 结果 。 
指令 格式 : 
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减法 后 ASCII 调整 
(0 * ,ed ° 
? Ca ; 


减法 操作 后 调整 AX 中 的 结果 - 若 AL > 9，AAS 将 AH 减 1， 并 将 进位 和 辅助 进位 标志 位 置 1。 
指令 格式 ， 


OO 了 I SZ A Pp CC 


目的 操作 数 加 上 源 操作 数 和 进位 标志 位 。 操 作 数 大 小 必须 相同 . 
指令 格式 : 
ADC reg,reg ADC reg,imm 


ADC mem,reg ADC mem, imm 
ADC reg,mem ADC accum, imm 


oO DD I eo 


源 操作 数 与 目的 操作 数 相 加 ， 和 数 存 人 目的 操作 数 。 操 作 数 大 小 必须 相同 。 
指令 格式 : 

ADD reg,reg ADD reg, imm 

ADD mem, reg ADD mem,imm 

ADD reg,mem ADD accum, imm 


9 DD I SA 


EE 


目的 操作 数 中 的 每 一 位 与 源 操作 数 中 的 对 应 位 进行 AND 操作 。 
指令 格式 : 
AND reg,reg AND reg,imm 
AND mem,reg AND mem, imm 
AND reg,mem AND accum, imm 





检查 数组 边界 ( 80286 ) 


验证 一 个 有 符号 索引 值 是 在 数组 边界 内 的 。 对 80286 处 理 器 来 说 ， 目 的 操作 数 可 以 为 任意 16 位 寄 


存 器 ， 该 寄存 器 为 待 检查 索引 。 源 操作 数 必须 是 一 个 32 位 内 存 操作 数 ， 其 高 字 和 低 字 分 别 为 索引 的 上 
边界 和 下 边界 。 对 x86 处 理 器 来 说 ， 目 的 操作 数 可 以 是 32 位 寄存 器 ， 而 源 操作 数 可 以 是 64 位 内 存 操 





BOUND regl16,mem32 BOUND r32,mem64 
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位 扫描 (x86 ) 


扫描 操作 数 ， 搜 索 第 一 个 等 于 1 的 位 。 若 发 现 这 样 的 位 ， 则 清除 零 标志 位 ， 并 把 该 位 的 位 号 (索引 ) 
赋 给 目的 操作 数 。 若 未 发 现 这 样 的 位 ， 则 ZF=1。BSF 的 检索 方向 为 从 位 0 到 最 高 位 ，BSR 则 从 最 高 
位 开始 ， 向 位 0 检索 。 

指令 格式 (BSF 和 BSR 均 适 用 ): 


BSF reg16,r/m16 BSF reg32,r/m32 


字 节 交换 (x86 ) 


反 转 32 位 目的 寄存 器 的 字 节 顺序 。 
指令 格式 : 


BSWAP reg32 


位 测试 (x86 ) 


将 指定 位 (m) 复制 到 进位 标志 位 。 目 的 操作 数 为 包含 指定 位 的 数值 ， 源 操作 数 为 该 位 在 目的 操作 数 


中 的 位 置 ， BT 将 位 复制 到 进位 标志 位 。BTC 将 位 n 复 制 到 进位 标志 位 ， 且 对 目的 操作 数 中 的 该 位 
取 反 。BTR 将 位 n 复制 到 进位 标志 位 ， 且 清除 目的 操作 数 中 的 该 位 。BTS 将 位 复制 到 进位 标志 位 ， 
且 将 目的 操作 数 中 的 该 位 置 1。 
指令 格式 : 
BT 1/m16, imm8 BT r/m16,r16 
BT r/m32,imm8 BT ¥/M32,732 


下 一 条 指令 地 址 人 栈 ， 再 转向 目的 地 址 。 若 过 程 属性 为 近 (同一 段 内 )， 则 仅 需 下 一 条 指令 的 偏 移 地 
址 入 栈 ; 否则 ， 下 一 条 指令 的 段 地 址 和 偏 移 地 址 都 需 人 栈 。 
指令 格式 : 
CALL neariliabe!l CALL memi6 


CALL farlabel CALL mem32 
CALL 


AL 中 的 符号 位 扩展 到 AH 寄存 器 。 
指令 格式 : 
CBW 
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双 字 转 为 四 字 (x86 ) 


EAX 中 的 符号 位 扩展 到 EDX 寄存 器 。 
指令 格式 ; 
CDQ 


清除 进位 标志 位 


Ls Se | T S i 
Es dy 


进位 标志 位 清 0。 
指令 格式 : 
CLIC 614 


清除 方向 标志 位 


oO DD ! S 4 A 下 C 
Ea 
方向 标志 位 清 0。 字 符 审 原 语 指令 将 自动 递增 (E) SI 和 (E) DI。 
指令 格式 : 
CLD 


清除 中 断 标志 位 


5 S Z A 了 C 
WE 3 Wl BE i I 
中 断 标志 位 清 0。 禁 止 可 屏蔽 硬件 中 断 ， 直 到 执行 了 STI 指令 。 
指令 格式 : 
CLI 


进位 标志 位 求 补 


取 反 进位 标志 位 的 值 。 
指令 格式 : 
CMC 


执行 隐 含 减法 操作 ， 从 目的 操作 数 中 减 去 源 操作 数 ， 以 实现 这 两 个 数 的 比较 。 
指令 格式 : 
CMP reg,reg CMP reg,imm 
CMP mem,reg CMP mem,imm 
CMP reg,mem CMP accum,imm [61: 
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OT VR 
le ees sl 
比较 字符 串 ， 其 内 存 地 址 由 DS: (E)SI 和 ES: (E)DI 指定 。 执 行 隐 含 操 作 ， 从 源 串 中 减 去 目的 串 。 
CMPSB 比较 字 节 ，CMPSW 比较 字 ，CMPSD 比较 双 字 (对 x86 处 理 器 )- 根据 操作 数 大 小 和 方向 
标志 位 状态 ,(E) SI 和 (E) DI 实现 递增 或 递减 。 若 方向 标志 位 置 1，(E) SI 和 (E) DI 递减 ; 否则 ， 
(E) SI 和 (E) DI 递增 - 
指令 格式 (已 忽略 显 式 使 用 操作 数 的 格式 ); 


CMPSB 
CMPSD 


O D I S Zz A P C 
Ee | 
比较 目的 操作 数 与 累加 器 (AL .AX 或 EAX) 内 容 。 若 两 者 相等 ， 则 源 操作 数 复制 到 目的 操作 数 。 


否则 ， 目 的 操作 数 复制 到 累加 器 。 
指令 格式 : 


CMPXCHG reg,reg CMPXCHG mem, reg 


AX 的 符号 位 扩展 到 DX 寄存 器 。 
指令 格式 : 
CWD 


加 法 后 十 进 制 调 整 


O DD 1 S Zh A 


ee 


两 个 压缩 BCD 数 相 加 后 ， 调 整 AL 中 的 二 进 制 和 数 。 将 AL 中 的 和 数 转换 为 两 个 BCD 数字 。 
指令 格式 : 
DAA 


减法 后 十 进 制 调整 


© D 1 S 站 
7 


两 个 压缩 BCD 数字 进行 减法 运算 后 ， 对 AL 中 的 二 进 制 结果 进行 转换 。 
指令 格式 : 
DAS 
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操作 数 减 1。 不 影响 进位 标志 位 。 
指令 格式 : 


DEC reg 


无 符号 整数 除法 


执行 8 位 、16 位 和 32 位 无 符号 整数 除法 。 若 除数 为 8 位 ， 则 被 除数 在 AX， 商 在 AL， 余 数 在 AH。 
若 除数 为 16 位 ， 则 被 除数 在 DX : AX， 商 在 AX， 余 数 在 DX。 若 除数 为 32 位 ， 则 被 除数 在 EDX ， 
EAX， 商 在 EAX， 余 数 在 EDX， 

指令 格式 : 


DIV reg 


构造 堆栈 帧 ( 80286 ) 


为 过 程 构造 堆栈 帧 ， 接 收 堆栈 参数 ， 使 用 局 部 堆栈 变量 。 第 一 个 操作 数 表 示 保 存 局 部 堆栈 变量 需要 
的 字 节 数 。 第 二 个 操作 数 表 示 过 程 嵌 套 层 数 (对 C、Basic 和 FORTRAN 必须 设置 为 0 )。 
指令 格式 : 


ENTER imml6,imm8 





暂停 CPU， 直 到 出 现 一 个 硬件 中 断 。( 注意: 在 硬件 中 断 发 生前 ， 需 用 STI 指令 设置 中 断 标 志 位 。) 
指令 格式 : 
HLT 


有 符号 整数 除法 


这 
对 EDX: EAX、DX : AX 或 AX 执行 有 符号 整数 除法 。 若 除数 为 8 位 ， 则 被 除数 在 AX， 商 在 AL， 
余数 在 AH。 车 除数 为 16 位 、 则 被 除数 在 DX : AX. 商 在 AX， 余 数 在 DX。 若 除数 为 32 位 ， 则 被 除 
数 在 EDX : EAX， 商 在 EAX， 余数 在 EDX。 通 常 ，IDIV 操作 的 前 面 会 有 CBW 或 CWD 对 被 除数 进 
行 符号 扩展 。 
指令 格式 : 


IDIV reg 
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对 AL、AX 或 EAX 执行 有 符号 整数 乘法 - 若 乘 数 为 8 位 ， 则 被 乘 数 在 AL， 乘 积 在 AX。 若 乘 数 为 
16 位 ， 则 被 乘 数 在 AX， 乘 积 在 DX : AX- 若 乘 数 为 32 位 ， 则 被 乘 数 在 EAX， 乘 积 在 EDX : EAX。 
车 16 位 乘积 扩展 到 AH，32 位 乘积 扩展 到 DX， 或 者 64 位 乘积 扩展 到 EDX， 那 么 ， 进 位 标志 位 和 洲 
出 标志 位 置 1。 

指令 格式 : 

单 操作 数 : 
IMUL rr/m8 r/mile6 
IMUL r/m32 


双 操 作 数 : 


IMUL r16,r/mi16 
IMUL £32,1r/m32 
IMUL r16,imml6 


三 操作 数 : 


IMUL ri1i6,r/mlé,imm8 r/m1l6, imm16 
IMUL r32,r/m32,imm8 r/m32, imm32 


从 端口 输入 一 个 字 节 到 AL， 或 一 个 字 到 AX。 源 操作 数 为 端口 地 址 ， 表 示 为 8 位 常数 , 或 DX 中 的 
16 位 地 址 。 对 x86 处 理 器 ， 可 以 从 端口 输入 双 字 到 EAX。 
指令 格式 : 


IN accum, imm IN accum,DXx 


寄存 器 内 容 或 内 存 操作 数 加 1。 
指令 格式 : 


INC reg 


从 端口 输入 字符 串 ( 80286 ) 


从 端口 输入 一 个 字符 串 到 ES : ( E) DI。DX 指定 端口 号 。 对 接收 到 的 每 个 值 ，(E) DI 按照 LODSB 
和 相似 的 字符 串 原 语 指令 进行 调整 。REP 前 缀 可 与 本 类 指令 一 起 使 用 。 
指令 格式 : 
INS dest,DX REP INSB dest ,DX 
REP INSW dest,DX REP INSD dest,DX 
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生成 软件 中 断 ， 调 用 操作 系统 子 程序 、 跳 转 到 中 断 子 程序 之 前 ， 清 除 中 断 标 志 位 ， 并 将 标志 寄存 
器 、CS 和 IP 人 栈 。 
指令 格式 : 


INT imm 


如 果 溢 出 标志 位 置 1， 则 生成 内 部 CPU 4 号 中 断 。 若 调用 了 INT 4， 则 MS-DOS 无 操作 ， 但 可 以 
用 用 户 编写 的 子 程序 来 代替 。 
指令 格式 : 
INTO 


从 中 断 处 理 程序 返回 。 将 栈 顶 内 容 送 入 (E) IP、CS 和 标志 寄存 器 。 
指令 格式 : 
IRET 


车 指定 标志 位 条 件 为 真 ， 则 跳 转 到 标号 。 对 x86 之 前 的 处 理 器 ， 标 号 与 当前 位 置 的 距离 范围 
为 -128 一 +127 字 节 。 对 x86 处 理 器 、 标 号 的 偏 移 量 可 以 是 正 / 负 32 位 数值 。 表 B-2 为 助 记 符 列表 。 
指令 格式 : 


Jcondition label 


表 B-2 条 件 跳 转 助 记 符 














助 记 符 含义 
I 等 于 则 跳 转 
INA 不 等 于 则 号 转 
JAE 为 办 则 跳 转 
IJNAE 不 为 夫 则 跳 转 
虽 负数 则 跳 转 
NB 非 负数 则 距 转 
JBE 有 进位 则 跳 转 
JNBE 无 进位 则 跳 转 


J6 溢出 则 中 转 
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( 续 ) 












含义 助 记 符 


不 关于 









无 溢出 则 跳 转 
奇偶 位 为 1 则 跳 转 
偶 校 验 则 跳 转 
奇偶 位 为 0 则 跳 转 
奇 校 验 则 跳 转 

不 小 于 或 等 于 则 跳 转 









若 CX 寄存 器 等 于 零 ， 则 跳 转 到 一 个 短 标号 。 该 标号 与 下 一 条 指令 的 距离 范围 为 -128 ~ +127 字 节 。 
对 x86 处 理 器 来 说 ，JECXZ 指令 的 含义 是 若 ECX 等 于 零 ， 则 跳 转 。 
指令 格式 : 


JCXZ shortlabel JECXZ shortlabel 


无 条 件 跳 转 到 标号 


跳 转 到 代码 标号 ， 短 跳 转 的 范围 是 ， 距 离 当 前 位 置 -128 ~ +127 字 节 。 近 跳 转 是 在 同一 代码 段 内 ， 
远 跳 转 则 转移 到 当前 段 之 外 。 
指令 格式 : 
JMP shortlabel JMP regl6 


JMP nearlabel JMP memlé6 
JMP farlabel JMP mem32 


将 标志 寄存 器 加 载 到 AH 


将 符号 标志 位 、 零 标志 位 、 辅 助 进 位 标志 位 、 奇 偶 标 志 位 以 及 进位 标志 位 复制 到 AH。 
指令 格式 : 
LAHE 


将 一 个 双 字 内 存 操作 数 的 内 容 加 载 到 一 个 段 寄存 器 和 一 个 指定 的 目标 寄存 器 。 若 使 用 x86 之 前 的 处 
理 器 ， 则 LDS 是 指 加 载 到 DS，LES 是 指 加 载 到 ES。 若 使 用 的 是 x86 处 理 器 ， 则 LFS 是 指 加 载 到 FS， 
LGS 是 指 加 载 到 GS，LSS 是 指 加 载 到 SS。 

指令 格式 (LDS、LES、LFS、LGS、LSS 均 相 同 ): 


LDS reg,mem 
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计算 并 加 载 内 存 操作 数 的 16 位 或 32 位 有 效 地 址 。 与 MOV..OFFSET 相同 ， 不 同 之 处 在 于 ， 只 有 
LEA 能 获得 运行 时 计算 地 址 。 
指令 格式 : 


LEA reg,mem 


退出 高 级 过 程 


结束 过 程 的 堆栈 帧 。 该 指令 是 ENTER 指令 的 逆 操 作 ，ENTER 指令 在 过 程 开始 ， 用 于 保存 (E) SP 
和 (E) BP 的 初始 值 。 
指令 格式 : 
LEAVE [622| 








锁定 系统 总 线 


在 其 后 指令 执行 期 间 ， 禁 止 其 他 处 理 器 执行 。 当 其 他 处 理 器 可 能 会 修改 CPU 当前 访问 的 内 存 操 作 数 
时 ， 可 以 使 用 本 指令 。 
指令 格式 ; 


LOCK instruction 


将 字符 串 加 载 到 累加 器 


将 DS : (E) SI 指定 的 内 存 字 节 或 字 加 载 到 累加 器 (AL、AX 或 EAX)。 若 使 用 的 是 LODS， 则 必须 
指定 内 存 操作 数 。LODSB 加 载 一 个 字 节 到 AL，LODSW 加 载 一 个 字 到 AX，x86 的 LODSD 加 载 一 个 
双 字 到 EAX。(E)SI 根据 操作 数 大 小 或 方向 标志 位 的 状态 进行 递增 或 递减 。 若 方向 标志 位 (DF1，(E) 
SI 递减 ; 若 DF=0, (E) SI 递增。 

指令 格式 : 

LODS mem 


LODS segreg:mem 
LODS 


ECX 减 1 后 ， 若 ECX 不 等 于 0， 则 跳 转 到 一 个 短 标号 。 目的 地 址 与 当前 地 址 的 距离 范围 为 
一 128 一 +127 字 节 。 
指令 格式 : 


LOOP shortlabel LOOPW shortlabel 
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循环 (x86 ) 


ECX 减 1 后 , 若 ECX 不 等 于 0， 则 跳 转 到 一 个 短 标号 。 目 的 地 址 与 当前 地 址 的 距离 范围 为 
一 128 一 +127 字 节 。 


指令 格式 : 


LOOPD shortlabel 


等 于 (为 零 ) 则 循环 


(E) CX 减 1 后 , 若 (E) CX > 0 且 零 标志 位 置 1， 则 跳 转 到 短 标号 。 
指令 格式 : 


LOOPE shortlabel LOOPZ shortlabel 


不 等 于 (为 零 ) 则 循环 


(E) CX 减 1 后 , 若 (E) CX > 0 目 零 标志 位 清 零 ， 则 跳 转 到 短 标号 。 
指令 格式 : 


LOOPNE shortlabel LOOPNZ shortlabel 


使 用 16 位 计数 器 的 循环 


CX 减 1 后 ， 车 CX 不 等 于 零 ， 则 跳 转 到 短 标号 。 目 的 地 址 与 当前 地 址 的 距离 范围 必须 
为 -128 一 +127 字 节 。 


指令 格式 : 


LOOPW shortlabel 





从 源 操 作 数 复制 字 节 或 字 到 目的 操作 数 。 


指令 格式 : 


MOV reg,reg MOV reg, imm 
MOV mem, reg MOV mem, imm 
MOV reg, mem MOV mem16, seg9re9 
MOV regl6,segreg MOV se9re9,mem16 
MOV segreg, reg16 
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从 DS : (E) SI 指定 内 存 地址 复制 一 个 字 节 或 字 到 ES : (E) DI 指定 的 内 存 地 址 。MOYVS 要 求 指定 
两 个 操作 数 。MOVSB 复制 一 个 字 节 ,MOVSW 复制 一 个 字 ， 对 x86 来 说 ,MOVSD 复制 一 个 双 字 。(E) 
SI 和 (E) DI 按 照 操作 数 大 小 和 方向 标志 位 的 状态 递增 或 递减 。 若 方向 标志 位 (DF) =1, 则 (E) SI 
和 (E) DI 递减 ; 若 DF=0, 则 (E) SI 和 (E) DI 递增 。 

指令 格式 : 

MOVSB 

MOVSW 

MOVSD 

MOVS dest, source 

MOVS ES:dGest, segreg:source 


符号 扩展 传送 


从 源 操作 数 复制 一 个 字 节 或 字 到 目的 寄存 器 . 并 对 目的 寄存 器 的 高 位 进行 符号 扩展 。 本 指令 用 于 
将 8 位 或 16 位 操作 数 复制 到 更 大 的 目的 操作 数 。 
指令 格式 : 


MOVSX reg32,reg8 
MOVSX reqg32,regl6 MOVSX reg32,memi6 
MOVSX regqié,reg8 MOVSX reg916,ma 


从 源 操作 数 复制 一 个 字 节 或 字 到 目的 寄存 器 ,并 对 目的 寄存 器 的 高 位 进行 零 扩 展 。 本 指令 用 于 将 8 
位 或 16 位 操作 数 复制 到 更 大 的 目的 操作 数 。 
指令 格式 : 
MOVZX rea32,reg8 


MOVSX reg32,regil6 MOVSX reg32,memilé 
MOVSX reglé6,reg8 MOVSX regl6,m8 


Bro Dr “Sv eA 
I | | 
源 操作 数 与 AL、AX 或 EAX 相 乘 。 若 源 操作 数 为 8 位 ， 则 与 AL 相 乘 ， 乘 积 保存 在 AX。 若 源 操 
作 数 为 16 位 ， 则 与 AX 相 乘 ， 乘 积 保存 在 DX : AX。 若 源 操作 数 为 32 位 ， 则 与 EAX 相 乘 ， 乘 积 保 
存在 EDX: EAX- 
指令 格式 : 





MUL reg 
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计算 目的 操作 数 的 补 数 ， 并 将 结果 保存 到 目的 操作 数 。 
指令 格式 : 


NEG reg 


本 指令 不 执行 任何 操作 ,但 可 用 于 定时 循环 ， 或 者 将 后 续 指令 对 齐 到 字 边 界 。 
指令 格式 : 


对 操作 数 进行 逻辑 NOT 操作 ， 即 对 操作 数 的 每 一 位 取 反 。 
指令 格式 ， 


NOT reg 


对 目的 操作 数 的 每 一 位 和 源 操 作 数 的 对 应 位 执行 布尔 ( 按 位 ) OR 操作 。 
指令 格式 : 
OR reg,reg OR reg,imm 


OR mem,reg OR mem,imm 
OR reg,mem OR accum,imm 


若 使 用 x86 之 前 的 处 理 器 ， 本 指令 从 累加 器 向 端口 输出 一 个 字 节 或 字 。 如 果 端 口 地 址 在 0 一 FFh 之 
内 ， 则 它 可 以 是 一 个 常数 ;如 果 端 口 地 址 在 0 ~ FFFFh， 则 可 用 DX 包含 端口 地 址 。 对 x86 处 理 器 ， 
可 以 向 端口 输出 一 个 双 字 。 

指令 格式 : 


OUT imm8,accum OUT DX,accum 
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向 端口 输出 字符 串 ( 80286 ) 


将 ES : (E) DI 指 向 的 字符 串 输出 到 端口 。 端 口号 由 DX 指定 。 对 输出 的 每 个 数值 ，(E) DI 按照 
LODSB 和 相似 的 字符 串 原 语 指令 进行 调整 。REP 前 缀 可 与 本 类 指令 一 起 使 用 。 
指令 格式 : 
OUTS dest,DX REP OUTSB dest,DX 
REP OUTSW dest,DX REP OUTSD dest,DX 


将 当前 堆栈 指针 指向 的 一 个 字 或 双 字 复制 到 目的 操作 数 ， 再 执行 (E) SP 加 2 (或 者 4 )。 
指令 格式 : 


POP regl6/r32 POP segreg 
POP ”mem165/merm32 


从 栈 项 弹出 16 个 字 节 , 按照 DI、SI、BP、SP、BX、DX、CX、AX 的 顺序 ， 分 别 送 入 8 个 通用 寄存 器 。 
SP 的 值 委 弃 ， 因 此 不 再 分 配 。POPA 将 值 弹出 到 16 位 寄存 器 ，x86 的 POPAD 将 值 弹出 到 32 位 寄 


从 堆栈 弹出 到 标志 寄存 器 


O D I S Z A 条 全 
医治 区 到 玫 玛 攻 尖 区 到 区 到 队列 医 光 
POPF 将 栈 顶 弹 出 到 16 位 FLAGS 寄存 器 。x86 的 POPFD 将 栈 顶 弹出 到 32 位 EFLAGS 寄存 器 。 
指令 格式 : 


POPF 


车 人 栈 的 是 16 位 操作 数 ， 则 ESP-2。 若 人 栈 的 是 32 位 操作 数 ， 则 ESP-4。 然 后 ， 将 操作 数 复制 到 
ESP 指向 的 堆栈 位 置 。 
指令 格式 : 


PUSH reglé6/reg32 PUSH segreg 
PUSH memli6/mem32 PUSH imm1i6/imm32 
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PUSHA， | 全 部 入 栈 ( 80286 ) 
PUSHAD 


按照 AX、CX、DX、BX、SP、BP、SI 和 DI 的 顺序 ， 将 这 些 16 位 寄存 器 人 栈 。x86 的 PUSHAD 
指令 压 人 的 是 EAX、ECX、EDX、EBX、ESP、EBP、ESI 和 EDI。 
指令 格式 : 


PUSHA PUSHRAD 


PUSHF ， | 标志 寄存 器 入 栈 
PUSHFD 


PUSHF 将 16 位 FLAGS 寄存 器 人 栈 。PUSHFD 将 32 位 EFLAGS 人 栈 (x86 )。 
指令 格式 : 


PUSHF PUSHFD 


PUSHW 将 一 个 16 位 的 字 人 栈 ，x86 的 PUSHD 指令 将 一 个 32 位 的 双 字 人 栈 。 
指令 格式 : 


PUSH regl6/reg32 PUSH segreg 
PUSH memlé6/mem32 PUSH immi6/imm32 


目的 操作 数 循环 左 移 ， 源 操作 数 确定 循环 次 数 。 进 位 标志 位 复制 到 最 低位 ， 最 高 位 复制 到 进位 标志 
位 。 对 8086/8088 处 理 器 ，imm8 必须 为 1。 
指令 格式 : 


RCL reg, imm8 RCL mem, imm8 
RCL reg,cL RCL mem,CL 


目的 操作 数 循环 右 移 ， 源 操作 数 确定 循环 次 数 。 进 位 标志 位 复制 到 最 高 位 ， 最 低位 复制 到 进位 标志 
位 。 对 8086/8088 处 理 器 ，imm8 必须 为 1。 
指令 格式 : 
RCR reg, imm8 RCR mem,imm8 
RCR reg,cL RCR mem,CcL 
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重复 字符 串 原 语 指令 ， 其 中 (E) CX 为 计数 器 。 指 令 每 重复 一 次 , (E) CX 减 1， 直 到 (E) CX=0。 
格式 (以 MOVS 为 例 ): 


REP MOVS dest,source 


REP 有 条 件 重复 字符 串 操 作 
condition 


(E) CX=0 且 标 志 位 条 件 为 真 ， 则 重复 字符 串 原 语 指 令 。REPZ (REPE) 的 重复 条 件 为 零 标志 位 置 1 ; 
REPNZ (REPNE) 的 重复 条 件 为 零 标 志 位 清 零 。 只 有 SCAS 和 CMPS 能 与 REP condition 一 起 使 用 ， 
为 只 有 这 两 条 字符 串 原 语 指 令 会 修改 零 标志 位 。 

格式 (以 SCAS 为 例 ): 

REPZ SCAS dest REPNE SCAS dest 


REPZ SCASB REPNE SCASB 
REPE SCASW REPNZ SCASW 


从 堆栈 弹出 返回 地 址 。RETN (retum near) 只 将 栈 顶 弹出 到 (E) IP。 在 实地 址 模式 下 ,RETF (return 
far) 将 栈 顶 先后 送 入 (EE 和 CS。 按照 PROC 伪 指 令 指定 或 暗示 的 属性 ,RET 可 以 为 近 ， 也 可 以 为 远 。 
8 位 立即 数 为 可 选项 ， 告 诉 CPU 在 弹出 返回 地 址 后 ,(E) SP 应 该 加 上 的 数值 。 

指令 格式 : 

RET RET imm8 


RETN RETN jimm8 
RETF RETF jimm8 





目的 操作 数 循环 左 移 ， 源 操作 数 确定 循环 次 数 。 最 高 位 复制 到 进位 标志 位 ， 同 时 移 人 最 低位 。 使 用 
8086/8088 处 理 器 时 ， 操 作 数 imm8 必须 为 1。 
指令 格式 : 


ROL reg,imm8 ROL mem,imm8 
ROL reg,CL ROL mem,CcL 
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目的 操作 数 循环 右 移 ， 源 操作 数 确定 循环 次 数 。 最 低位 复制 到 进位 标志 位 ， 同 时 移 人 最 高 位 。 使 用 
8086/8088 处 理 器 时 ， 操 作 数 imm8 必须 为 1。 
指令 格式 : 


ROR reg,imm8 ROR mem,imm8 
ROR reg,cL ROR mem,CL 
AH 保存 到 标志 寄存 器 


.0 | I 号 二 


将 AH 复制 到 标志 寄存 器 的 位 0 一 位 7。 
指令 格式 ， 


9” 卫 I SS 


Ee pe 


将 目的 操作 数 的 每 一 位 都 向 左 移 ， 源 操作 数 确定 移动 次 数 。 最 高 位 复制 到 进位 标志 位 ， 最 低位 用 0 
填充 。 若 使 用 8086/8088 处 理 器 ， 则 操作 数 imm8 必须 为 1。 


指令 格式 : 


SAL reg, imm8 SAL mem, imm8 
SAL reg,CcL SAL mem,cL 


O DD 1 ~ 


ESE EE 


将 目的 操作 数 的 每 一 位 都 向 右 移 ， 源 操作 数 确定 移动 次 数 。 最 低位 复制 到 进位 标志 位 ， 最 高 位 保持 
不 变 。 本 指令 常用 于 有 符号 操作 数 ， 因 为 可 以 保持 数值 符号 位 。 若 使 用 8086/8088 处 理 器 ， 则 操作 数 
imm8 必须 为 1。 

指令 格式 : 

SAR reg,imm8 SAR mem, imm8 
SAR reg,CL SAR mem,CL 


0 D I S Zz A 用 C 
Ey 
目的 操作 数 减 去 源 操作 数 ， 再 减 去 进位 标志 位 。 
指令 格式 : 

SBB reg,reg SBB reg,imm 


SBB mem,reg SBB mem, imm 
SBB reg,mem 
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0 
区 
扫描 由 ES: (E) DI 指定 的 内 存 字 符 串 ， 寻 找 与 累加 器 匹配 的 数值 。SCAS 要 求 指定 操作 数 。SCASB 
扫描 与 AL 匹配 的 8 位 数值 ，SCASW 扫描 与 AX 匹配 的 16 位 数值 ，SCASD 扫描 与 EAX 匹配 的 32 位 
数值 。(E)DI 按照 操作 数 大 小 和 方向 标志 位 的 状态 递增 或 递减 。 如 果 DF=1，(E)DI 递减 ; 若 FD=0，(E) 
DI 递增 。 
指令 格式 : 
SCASB 
SCASD 


SCAS dest 
SCAS ES:dest 


SET 
condition 


若 给 定 标 志 条 件 为 真 ， 则 目的 操作 数 指 定 的 字 节 被 赋值 为 1。 若 标志 条 件 为 假 ， 则 目的 操作 数 被 赋 
值 为 0。condition 可 能 的 取 值 参 见 表 B-2。 
指令 格式 : 


SETcond reg8 SETcond mem8 


DO DD I S ZzZ A P Cc 
EE 
将 目的 操作 数 的 每 一 位 进行 左 移 ， 源 操作 数 确定 移动 次 数 。 最 高 位 复制 到 进位 标志 位 ， 最 低位 用 0 


填充 (与 SAL 相同 )。 若 使 用 8086/8088 处 理 器 ， 则 操作 数 imm8 必须 为 1。 
指令 格式 : 


SHL reg, imm8 SHL mem, imm8 
SHL reg,CL SHL mem,CL 


双 精 度 左 移 (x86 ) 


© DD ] S Zz A P C 
2 于 习 本 到 六 其 区 攻 攻 到 
将 第 二 操作 数 的 位 移 人 到 第 一 操作 数 ， 第 三 操作 数 表示 移动 的 位 数 。 位 移 导致 的 空位 ， 由 第 二 操作 
数 的 最 高 有 效 位 填充 。 第 二 操作 数 必须 为 寄存 器 ， 第 三 操作 数 可 以 是 立即 数 或 CL 寄存 器 。 

指令 格式 : 

SHLD regl16,regl16,imm8 SHLD meml16, re916, imm8 

SHLD reg32,reg32, imm8 SHLD mem32,reg32,imm8 

SHLD reg16.regl16,CL SHLD mem16, reglié6,CcL 

SHLD reg32,reg32,CL SHLD mem32,reg32,CL 





502 有 府 灵 已 


O D I S 汉 A 了 C 
Ea 大 首 格 可 医 马 改天 区 攻 长 
将 目的 操作 数 的 每 一 位 进行 右 移 ， 源 操作 数 确定 移动 次 数 。 最 高 位 用 0 填充 ， 最 低位 复制 到 进位 标 
志 位 。 若 使 用 8086/8088 处 理 器 ， 则 操作 数 imm8 必须 为 1。 
指令 格式 : 
SHR reg, imm8 SHR mem, imm8 
SHR reg,CL SHR mem,CL 


双 精 度 右 移 (x86 ) 


DO DD 1 S Z A 下 C 
| 
将 第 二 操作 数 的 位 移 人 到 第 一 操作 数 ， 第 三 操作 数 表 示 移 动 的 位 数 。 位 移 导致 的 空位 ， 由 第 二 操作 
数 的 最 低 有 效 位 填充 。 第 二 操作 数 必须 为 寄存 器 ， 第 三 操作 数 可 以 是 立即 数 或 CL 寄存 器 。 
指令 格式 : 
SHRD reg16,reg16,imm8 SHRD meml16,reg16, imm8 
SHRD reg32,reg32,1imm8 SHRD mem32,reg32, imm8 


SHRD regl16,reglé6,cL SHRD mem16, reg16,cL 
SHRD reg32,reg32,CcCL SHRD mem32, reg32,cL 


进位 标志 位 置 1。 
指令 格式 ， 


方向 标志 位 置 1， 使 得 执行 字符 串 原 语 指令 时 ，(E) SI 或 (E) DI 递减 。 由 此 ， 字 符 串 将 按照 由 高 到 
低 的 地 址 顺序 进行 处 理 。 
指令 格式 : 
STD 
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将 累加 器 存 人 由 ES : (E) DI 指定 的 内 存 位 置 。 若 使 用 的 是 STOS， 则 必须 指定 目的 操作 数 。STOSB 
将 AL 复制 到 内 存 ，STOSW 将 AX 复制 到 内 存 ，x86 处 理 器 的 STOSD 指令 将 EAX 复制 到 内 存 。(E) 


STOS ES :mem 


QO DD I Ss PC 


目的 操作 数 减 去 源 操作 数 。 
指令 格式 : 

SUB reg,imm 
SUB mem, imm 


SUB [reg,reg 
SUB accunm, imm 


SUB mem,reg 
SUB reg,mem 


oO DD I S 各 A 了 必 
Ee 
对 目的 操作 数 和 源 操作 数 中 的 每 组 对 应 位 进行 测试 。 执 行 的 逻辑 AND 操作 只 影响 标志 位 ， 不 影响 


目的 操作 数 。 
reg, imm 


指令 格式 : 
TEST 
TEST mem, imm 


TEST 
TEST 
TEST TEST accum, imm 


暂停 CPU 的 执行 ， 直 到 协 处 理 器 完成 当前 指令 。 


指令 格式 : 
WAIT 


交换 并 相 加 (Intel486 ) 
O D I S Z A 心 
区 区 了 攻 到 卫 纪 虹 汉 
源 操 作 数 加 上 目的 操作 数 。 同 时 ， 目 的 操作 数 的 初始 值 送信 源 操作 数 。 


指令 格式 : 
XRDD reg,reg XADD mem,reg 
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交换 源 操作 数 与 目的 操作 数 的 内 容 。 
指令 格式 : 


XCH reg,reg XCH mem,reg 
XCH reg, mem 


以 AL 的 值 为 索引 ， 检索 DS : BX 指向 的 表格 。 将 索引 指向 的 字 节 送 入 AL。 可 以 指定 操作 数 以 进 
行 段 超越 。XLATB 可 以 替代 XLAT。 
指令 格式 : 
XLAT XLAT segreg:mem 
XLAT mem XLATB 


@ DD 1 SS Eo 
| 
源 操作 数 中 的 每 一 位 与 目的 操作 数 的 对 应 位 进行 异 或 运算 。 仅 当 源 操作 数 和 目的 操作 数 初始 对 应 位 
不 相同 时 ， 目 的 位 的 运算 结果 为 1。 
指令 格式 : 


XOR reg,reg XOR reg, imm 
XOR mem,reg XOR mem, imm 
XOR reg,mem XOR accum, imm 


B.3 浮 点 数 指令 


表 B-3 列 出 了 所 有 的 x86 浮 点 指令 ， 并 给 出 了 操作 数 格 式 和 简要 说 明 。 指 令 一 般 是 按 功 
能 分 类 ， 而 非 严 格 的 字母 顺序 。 比 如 ，FIADD 指令 紧 跟 在 FADD 和 FADDP 的 后 面 ， 其 原 
因 就 是 该 指令 对 整数 进行 转换 ， 并 执行 了 和 这 两 条 指令 同样 的 操作 。 

浮 点 指令 的 完整 信息 请 参阅 Intel Architecture Manuals ( Intel 架构 说 明 书 )。 表 中 术语 堆 
栈 是 指 FPU 寄存 器 堆栈 。( 表 B-1 列 出 了 描述 浮 点 指令 格式 和 操作 数 时 使 用 的 一 些 符 号 。) 





表 B-3 浮 点 指令 
指令 说 明 
F2XMI 计算 2 一 1。 无 操作 数 
FABS 绝对 值 。 清 除 ST ( 0 ) 的 符号 位 。 无 操作 数 
浮 点 加 法 。 目 的 操作 数 与 源 操作 数 相 加 ， 和 数 保存 在 目的 操作 数 。 格 式 : 

FADD Add ST(0) to ST(1), and pop stack 
FADD FADD m32fp Add m32fp to ST(0) 

FADD m64fp Add mé4dfp to ST(0) 

FADD ST(0),sT(i) Add ST(i) to ST(0) 


FADD ST(i),SsT(0) Add sT(0) to ST(i) 
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( 续 ) 
指令 说 明 

EAL 浮 点 数 相 加 并 出 栈 。 与 FADD 操作 相同 ， 然 后 执行 出 栈 操作 。 格 式 : 

FADDP ST(i),ST(0) Add ST(0) to ST(i) 

将 整数 转换 为 浮 点 数 并 相 加 。 目 的 操作 数 与 源 操作 数 相 加 ， 和 数 保存 在 目的 操作 数 。 格 式 : 

FIADD FIADD m32inr Add m32int to ST(0) 

FIADD mi6éinct Add ml6inc to ST(0) 
SL 加 载 BCD 码 。 将 BCD 形式 的 源 操作 数 转 换 为 扩展 双 精 度 浮 点 数 ， 并 入 栈 。 格 式 : 

FBLD m80bcd Push m80bcd onto register stack 


保存 BCD 整数 并 出 栈 。 将 ST (0 ) 寄存 器 中 的 数值 转换 为 18 位 压缩 BCD 整数 ， 并 保存 到 目的 操作 
FBSTP 数 ， 然 后 执行 出 栈 操作 。 格式: 


FBSTP m80bcd Store ST(0) into m80bcd, and pop stack 
FCHS 改变 符号 位 。ST ( 0 ) 符号 位 取 反 。 无 操作 数 


清除 异常 。 清 除 FPU 状态 字 中 的 浮 点 异常 标志 (PE、UE、OE、 ZE、 DE 和 焉 )， 异 常 总 状态 标志 (ES)， 
FCLEX ”| 堆栈 故障 标志 ( SF)， 以 及 忙 标志 (B)。 无 操作 数 。FNCLEX 执行 相同 的 操作 ， 而 不 检查 挂 起 的 未 屏蔽 
浮 点 异常 


浮 点 条 件 传送 。 测 试 EFLAGS 中 的 状态 标志 ， 若 给 定 测试 条 件 为 真 ， 则 将 源 操作 数 第 二 操作 数 ) 传 
送 到 目的 操作 数 (第 一 操作 数 )。 格 式 : 


FCMOVB ST(0),ST(i) Move if below 
FCMOVE ST(0),SsT(i) Move if equal 
FCMOVec FCMOVBE ST(0),ST(i) Move if below or equal 
FCMOVU ST(0),SsST(i) Move if unordered 
FCMOVNB ST(0),ST(i) Move if not below 
FCMOVNE ST(0),ST(i) Move if not equal 
FCMOVNBE ST(0),ST(i) Move if not below or equal 
FCMOVNU ST(0),ST(i) Move if not unordered 
比较 浮 点 值 。 比 较 ST ( 0 ) 与 源 操作 数 ， 根 据 比 较 结果 设置 FPU 状态 字 的 条 件 编码 标志 CO0、C2 和 
C3。 格 式 : 
FCOM m32fp Compare ST(0) to m32fp 
FCOM m64dfp Compare ST(0) to mé64dfp 
FCOM FCOM ST(i) Compare ST(0) to ST(i) 
FCOM Compare ST(0) to ST(1) 


FCOMP 执行 与 FCOM 相同 的 操作 ， 然 后 执行 出 栈 操作 。FCOMPP 执行 与 FCOM 相同 的 操作 ， 再 执 
行 两 次 出 栈 。FUCOM 、FUCOMP 和 FUCOMPP 分 别 与 FCOM、FCOMP 和 FCOMPP 相同 ， 区 别 在 于 ， 
前 者 要 检查 无 序 值 
比较 浮 点 值 并 设置 EFLAGS。 执 行 寄存 器 ST (0) 与 ST (i) 的 无 序 比 较 ， 根 据 比 较 结果 设置 
EFLAGS 寄存 器 中 的 状态 标志 (ZF、PF 和 CF)。 格 式 : 
FCOMI FCOMI ST(0),ST(i) Compare ST(0) to ST(i) 
FCOMIP 执行 与 FCOMI 相同 的 操作 ， 然 后 执行 出 栈 操作 。FUCOMI 和 FUCOMIP 要 检查 无 序 值 
FCOS 余弦 。 计 算 ST (0 ) 的 余弦 值 ， 并 将 结果 保存 到 ST ( 0 )。 输 入 必须 为 弧度 。 无 操作 数 
FDECSTP | ” 栈 顶 指针 减 1。 将 FPU 状态 字 的 TOP 字段 减 1， 有 效 地 轮换 堆栈 内 寄存 器 。 无 操作 数 
浮 点 数 相 除 并 出 栈 。 目 的 操作 数 除 以 源 操 作 数 ， 结 果 保 存 到 目的 操作 数位 置 。 格 式 : 


FDIV ST(1) = ST(1Y} / T(0), and pop stack 
FDIV FDIV m32fp sT(0) = ST(0) / m32fp 

FDIV m64dfp ST(0) = ST(0) / mé6dfp 

FDIV ST(0),ST(i) ST(0) = ST(0) / SsT(i) 

FDIV ST(i),ST(0) ST(i) = ST(i) / sT(0) 


637 


638 


506 府 有 录 B 


( 续 ) 
指令 说 阴 
浮 点 数 相 除 并 出 栈 。 与 FDIV 相同 ， 再 执行 出 栈 操作 。 格 式 : 
FDIVP 
FDIVP ST(i),ST(0) ST(i) = ST(i) / ST(0), and pop stack 
整数 转换 为 浮 点 数 ， 并 执行 除法 。 转 换 后 ,执行 与 FDIV 相同 的 操作 。 格 式 : 
FIDIV FIDIV m32int ST(0) = ST(0) / m32int 
FIDIV mil6int ST(0) = ST(0) / mil6int 
反 向 除法 。 源 操作 数 除 以 目的 操作 数 ， 结 果 保 存在 目的 操作 数位 置 。 格 式 : 
FDIVR ST(0) = ST(0) / ST(1), and pop stack 
FDIVR FDIVR m32fp ST(0) = m32fp / ST(0) 
FDIVR m64fp ST(0) = m64dfp / ST(0) 
FDIVR ST(0)ST(i) ST(0) = ST(i) / ST(0) 
FDIVR ST(i),ST(0) ST(i) = ST(0) / ST(i) 
反 向 除法 并 出 栈 。 执 行 与 FDIVR 相同 的 操作 ， 并 执行 出 栈 操作 。 格 式 : 
FDIVRP 
FDIVRP ST(i),ST(0) ST(i) = ST(0) / ST(i), and pop stack 
整数 转换 为 浮 点 数 ， 并 执行 反 向 除法 。 转 换 后 ， 执 行 与 FDIVR 相同 的 操作 。 格 式 : 
FIDIVR FIDIVR m32int ST(0) = m32int / sT(0) 
FIDIVR mil6éint ST(0) = ml6int / ST(0) 
释放 浮 点 寄存 器 。 用 Tag 字 设 置 寄存 器 为 空 。 格 式 : 
FFREE 
FFREE ST(i) ST(i) = empty 
整数 比较 。 比 较 ST (0 ) 中 的 值 与 源 操作 数 中 的 整数 ， 根 据 结果 设置 条 件 编码 标志 CO0、C2 和 C3。 比 
较 前 ， 要 将 源 操 作 数 中 的 整数 转换 为 浮 点 数 。 格 式 : 
FICOM FICOM m32int Compare ST(0) to m32int 
FICOM mil6irt Compare ST(0) to miéinct 
FICOMP 执行 与 FICOM 相同 的 操作 ， 并 出 栈 
整数 转换 为 浮 点 数 并 加 载 到 寄存 器 堆栈 。 格 式 : 
FILD FILD mi6é6int Push miéint onto register stack 
FILD m32int Push m32int onto register stack 
FILD m64dint Push m64dint onto register stack 


FINCSTP 栈 顶 指针 加 1。FPU 状态 字 的 TOP 字段 加 1。 无 操作 数 

浮 点 单元 初始 化 。 将 控制 寄存 器 、 状 态 寄 存 器 、 标 签 寄 存 器 、 指 令 指针 寄存 器 和 数据 指针 寄存 器 设置 
为 默认 状态 。 控 制 字 设置 为 037Fh (就 近 仿 人， 屏蔽 所 有 异常 ，64 位 精度 )。 状 态 字 被 清除 (异常 标志 均 
为 0,TOP=0 )。 寄 存 器 堆栈 中 的 数据 寄存 器 不 变 ， 但 其 标签 设 为 空 。 无 操作 数 .FNINIT 执行 相同 的 操作 ， 
但 不 检查 挂 起 的 非 屏 蔽 浮 点 异常 

将 整数 保存 到 内 存 操 作 数 。 将 ST ( 0 ) 保存 到 有 符号 整数 内 存 操作 数 ， 按 照 FPU 控制 字 的 RC 字段 进 
行 伟人 。 格 式 : 


FIST milé6int Store ST(0) in miéint 
FIST FIST m32int Store ST(0) in m32int 


FINIT 


FISTP 执行 与 FIST 相同 的 操作 ， 再 出 栈 。 该 指令 还 有 一 种 格式 : 
FISTP m64dint Store ST(0) in m64dint, and pop stack 


截断 并 保存 整数 。 执 行 与 FIST 相同 的 操作 ， 但 是 会 自动 截断 整数 并 执行 出 栈 操作 。 格 式 : 


FISTTP FISTTP ml6int Store ST(0) in mléint, and pop stack 
FISTTP m32int Store ST(0) in m32int, and pop stack 
FISTTP m64int Store ST(0) in m64int, and pop stack 
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( 续 ) 
指令 说 明 
加 载 浮 点 数 到 寄存 器 堆栈 。 格 式 : 

FLD m32fp Push m32fp onto register stack 
FLD FLD m64fip Push mé64fp onto register stack 

FLD m80fp Push m80fp onto register stack 

FLD ST(i) Push ST(i) onto register stack 
FLD1 加 载 +1.0 到 寄存 器 堆栈 。 无 操作 数 


FLDL2T 加 载 logz10 到 寄存 器 堆栈 。 无 操作 数 
FLDL2E 加 载 logze 到 寄存 器 堆栈 。 无 操作 数 
FLDPI 加 载 T 到 寄存 器 堆栈 。 无 操作 数 
FLDLG2 加 载 log1o2 到 寄存 器 堆栈 。 无 操作 数 
FLDLN2 加 载 log。2 到 寄存 器 堆栈 。 无 操作 数 


FLDZ 加 载 +0.0 到 寄存 器 堆栈 。 无 操作 数 
ROSS 加 载 16 位 内 存 值 到 FPU 控制 字 。 格 式 : 
5 FLDCW m2byte Load FPU control word from m2byte 
从 内 存 加 载 FPU 环境 到 FPU。 格 式 : 
FLDENV 
FLDENV ml4/28byte Load FPU environment from memory 
浮 点 数 乘 法 。 目 的 操作 数 与 源 操作 数 相 乘 ， 乘 积 保存 到 目的 操作 数 。 格 式 : 
FMUL ST(1) = ST(1) * ST(0), and pop stack 
FMUL FMUL m32fp ST(0) = ST(0) * m32fp 
FMUL mé4fp ST(0) = ST(0) * m64fp 
FMUL ST(0),ST(i) ST(0) = ST(0) * ST(i) 
FMUL ST(i),ST(0) sm ee SL STLOY 
B 浮 点 数 相 乘 ， 并 出 栈 。 执 行 与 EMUL 相同 的 操作 ， 然 后 执行 出 栈 操作 。 格 式 : 
FMUL 
FMULP ST(i),ST(0) ST(i) = ST(i) * ST(0), and pop stack 
整数 转换 并 相 乘 。 源 操作 数 转换 为 浮 点 数 ， 并 与 ST ( 0) 相 乘 ， 乘 积 保存 到 ST ( 0 )。 格 式 : 
FIMUL FIMUL mi6int 
FIMUL m32int 
FNOP 无 操作 。 无 操作 数 


FPATAN 部 分 反正 切 。 用 arctan(ST (1 ) /ST (0 )) 替换 ST (1 )， 并 执行 出 栈 操 作 。 无 操作 数 


RE 部 分 余数 。 用 ST(0)/ST(1 ) 的 余数 替换 ST( 0 )。 无 操作 数 。FPREMI1 与 之 相似 , 用 ST(0)/ST(1) 
的 IEEE 余数 替换 ST (0 ) 


FPTAN 部 分 正切 。 用 ST (0 ) 的 正切 值 替 换 其 原 值 ， 并 将 1.0 送 入 FPU 堆栈 。 输 入 必须 为 弧度 。 无 操作 数 
FRNDINT | “” 售 入 到 整数 。 将 ST (0 ) 舍 人 到 最 近 的 整数 值 。 无 操作 数 
恢复 x87 FPU 状态 。 从 源 操 作 数 指定 的 内 存 区 域 加 载 FPU 状态 (操作 环境 和 寄存 器 堆栈 )。 格 式 : 


FRSTOR 
FRSTOR m94/108byte 
保存 x87 FPU 状态 。 将 FPU 状态 (操作 环境 和 寄存 器 堆栈 ) 保存 到 目的 操作 数 指定 的 内 存 区 域 ,再 
重新 初始 化 FPU。 格式 : 
FSAVE 


FSAVE m94/108byte 


FNSAVE 执行 相同 的 操作 ， 但 不 检查 挂 起 的 非 屏蔽 浮 点 异常 
FSCALE 比例 。 将 ST ( 1 ) 截断 为 整数 ， 再 加 上 目的 操作 数 ST ( 0 ) 的 阶 码 。 无 操作 数 
FSIN 正弦 。 用 ST (0 ) 的 正弦 替代 其 原 值 。 输 入 必须 为 弧度 。 无 操作 数 


正弦 和 余弦 。 计 算 ST (0 ) 的 正弦 和 余弦 。 输 入 必须 为 弧度 。 用 正弦 值 蔡 换 ST ( 0 )， 余 弦 值 送 入 寄 


FSINCOS | 存 器 堆栈 。 无 操作 数 
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指令 
FSQRT 


FST 


FSTCW 


FSTENV 


FSTSW 


FSUB 


FSUBP 


FISUB 


FSUBR 


FSUBRP 


FISUBR 


FTST 


附录 BB 
( 续 ) 
说 明 
平方 根 。 用 ST ( 0 ) 的 平方 根 蔡 换 其 原 值 。 无 操作 数 
保存 浮 点 值 。 格 式 ; 
FST mi32fp Copy ST(0) to m32fp 
FST m64dfp Copy ST(0) to m64fp 
FST ST(i) Copy ST(0) to ST(i) 


FSTP 执行 与 FST 相同 的 操作 ， 再 执行 出 栈 操作 。 该 指令 还 有 一 种 格式 : 
FSTP m80fp Copy ST(0) to m80fp, and pop stack 
保存 FPU 控制 字 。 格 式 : 
FLDCW m2byte Store FPU control word to m2byte 


FNSTCW 执行 相同 的 操作 ， 但 不 检查 挂 起 的 非 屏蔽 浮 点 异常 


保存 FPU 环境 。 根 据 处 理 器 为 实 模式 或 保护 模式 ， 将 FPU 环境 保存 到 m14byte 或 m28byte 结构 。 格 
式 : 


FSTENV memop Store FPU environment to memop 


FNSTENYV 执行 相同 的 操作 ， 但 不 检查 挂 起 的 非 屏蔽 浮 点 异常 
保存 FPU 状态 字 。 格 式 : 


FSTSW m2byte Store FPU status word to m2byte 
FSTSW AX Store FPU status word to AX register 
FNSTSW 执行 相同 的 操作 ， 但 不 检查 挂 起 的 非 屏蔽 浮 点 异常 
浮 点 数 减法 。 目 的 操作 数 减 去 源 操作 数 ， 差 值 保存 到 目的 操作 数 。 格 式 : 


FSUB ST(0),ST(i) SsT(0) ST(0) 一 ST(i) 
FSUB ST(i),ST(0) sT(i) ST(i) 一 ST(0) 


浮 点 数 相 减 并 出 栈 。FSUBP 执行 与 FSUB 相同 的 操作 ， 然 后 执行 出 栈 操 作 。 格 式 : 


FSUB ST(0) = ST(1) 一 ST(0)，and pop stack 
FSUB m32fp ST(0) = ST(0) — m32fp 
FSUB m64fp ST(0) = ST(0) — m64fp 


FSUBP ST(i),ST(0) ST(i) = ST(i) — ST(0), and pop stack 


整数 转换 为 浮 点 数 并 执行 减法 。 源 操作 数 转 换 为 浮 点 数 后 ,ST( 0 ) 减 去 该 数 ， 运 算 结 果 保存 到 ST 0 ) 。 
格式 : 


FISUB ml6int sT(0) 
FISUB m32int sT(0) 


ST(0) 一 mi6int 
ST(0) 一 m32int 


反 向 浮 点 数 减法 。 源 操作 数 减 去 目的 操作 数 ， 差 值 保 存 到 目的 操作 数 。 格 式 : 


FSUBR ST(0),ST(i) ST(0) = ST(i) — ST(0) 
FSUBR ST(i),ST(0) ST(i) = ST(0) — ST(i) 


反 向 浮 点 数 减法 并 出 栈 。FSUBRP 执行 与 FSUB 相同 的 操作 ， 再 执行 出 栈 操作 。 格 式 : 
FSUBRP ST(i),ST(0) ST(i) = ST(0) — ST(i), and pop stack 


整数 转换 并 执行 反 向 浮 点 减法 。 转 换 为 浮 点 数 后 ， 执 行 与 FSUBR 相同 的 操作 。 格式 : 


FISUBR ml6int 
FISUBR m32int 


测试 。 比 较 ST (0 ) 与 0.0， 并 设置 FPU 状态 字 中 的 条 件 编码 标志 。 无 操作 数 


FSUBR ST(0) = ST(0) — ST(1), and pop stack 
FSUBR m32fp ST(0) = m32fp 一 ST(0) 
FSUBR m64fp ST(0) = m64fp — ST(0) 
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( 续 ) 
指令 说 明 
FWAIT 等 待 。 等 待 所 有 挂 起 的 浮 点 异常 处 理 器 程序 完成 。 无 操作 数 
FXAM 检查 。 检 查 ST ( 0 )， 并 设置 FPU 状态 字 中 的 条 件 编码 标志 。 无 操作 数 
交换 寄存 器 内 容 。 格 式 : 


EXCH FXCH ST(i) Exchange ST(0) and ST(i) 
FXCH Exchange ST(0) and ST(1) 


恢复 x87 FPU、MMX 技术 、SSE 和 SSE2 状态 。 从 源 操 作 数 指定 的 内 存 映像 重新 加 载 FPU、MMX 
FXRSTOR | 技术 、XMM 和 MXCSR 寄存 器 。 格 式 : 
FXRSTOR m512byte 
保存 x87 FPU、MMX 技术 、SSE 和 SSE2 状态 。 将 FPU、MMX 技术 、XMM 和 MXCSR 寄存 器 的 
FXSAVE ”| 当前 状态 保存 到 目的 操作 数 指定 的 内 存 映 像 。 格 式 ， 
FXRSAVE m512byte 


提取 阶 码 和 有 效 数字 。 从 ST (0) 的 源 操作 数 中 分 离 其 阶 码 和 有 效 数字 ， 阶 码 保存 到 ST (0 )， 有 效 
数字 送 和 寄存 器 堆栈 。 无 操作 数 
i 计算 y*log;x。 寄 存 器 ST (1) 为 y 值 ，ST (0) 为 x 值 。 由 于 堆栈 已 执行 出 栈 操作 ， 因 此 计算 结果 保 
存在 ST (0), 无 操作 数 


计算 ylog:(x+1)。 寄 存 器 ST (1) 为 y 值 ， ST (0) 为 x 值 。 由 于 堆栈 已 执行 出 栈 操作 ， 因 此 计算 结 
果 保 存在 ST ( 0 )。 无 操作 数 


FXTRACT 


FYL2XP!1 
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附录 C | 


Assembly Language for x86 Processors, Seventh Edition 


本 节 回顾 ”问题 答案 


附录 C 给 出 的 是 本 节 回 顾 中 问题 的 答案 ， 其 位 于 每 章 主 要 小 节 的 末尾 。 这 些 并 不 是 出 


现在 每 章 结尾 处 的 章节 复习 题 的 答案 ， 章 节 复 习题 答案 参见 Pearson Education 网 站 的 教师 辅 


导 


手册 。 


第 1 章 基本 概念 
1.1 欢迎 来 到 汇编 语言 的 世界 


k 


Do 


9， 


10 


lle 


汇编 器 将 源 代码 程序 从 汇编 语言 转换 为 机 器 语言 。 链 接 器 将 汇编 器 创建 的 独立 文件 组 合 起 
来 ， 形 成 一 个 可 执行 程序 。 


. 汇编 语言 是 一 个 很 好 的 开具， 学 习 它 可 以 了 解 到 应 用 程序 是 如 何 通过 中 断 处 理 、 系 统 调用 


和 共享 内 存 区 域 来 实现 与 计算 机 操作 系统 的 通信 。 汇 编 语言 编程 同样 也 有 助 于 学 习 操 作 系 
统 是 如 何 加 载 和 执行 应 用 程序 的 。 


, 一 对 多 关系 是 指 ， 一 条 语句 扩展 为 多 条 汇编 语言 或 机 器 指令 。 
. 一 种 语言 ， 若 其 源 程序 能 够 在 各 种 计算 机 系统 上 编译 和 运行 ， 则 称 该 语言 是 可 移植 的 。 


不 一 样 。 每 一 种 汇编 语言 要 么 基于 处 理 器 系列 ， 要 么 基于 特定 计算 机 。 


. 拒 入 式 系统 应 用 的 例子 有 : 汽车 燃油 和 点 火 系统 、 空 调控 制 系统 、 安 保 系统 、 飞 行 控制 系 


统 、 掌 上 电脑 、 调 制 解 调 器 、 打 印 机 和 其 他 智能 计算 机 外 设 。 


. 设备 驱动 器 是 一 种 程序 ， 其 作用 是 把 通用 操作 系统 命令 转换 为 只 有 制造 商 才 知 道 的 硬件 细 


节 的 具体 指令 。 


.C++ 不 允许 一 种 类 型 的 指针 赋值 给 另 一 种 类 型 的 指针 。 汇 编 语言 对 指针 则 没有 这 样 的 限 


制 。 

适合 于 汇编 语言 的 应 用 : 硬件 设备 驱动 程序 、 骨 入 式 系统 和 需要 直接 访问 硬件 的 计算 机 游 
戏 。 

. 高 级 语言 没有 提供 对 硬件 的 直接 访问 。 如 果 高 级 语言 可 以 直接 访问 硬件 ， 那 么 编程 时 就 
不 得 不 频繁 使 用 一 些 麻烦 的 编码 技术 ,这 就 可 能 导致 维护 问题 。 

汇编 语言 只 有 极 少 的 形式 结构 ， 因 此 必须 由 程序 员 设 计 结构 ， 而 程序 员 具 备 的 经 验 参 差 
不 齐 。 这 就 使 得 维护 现 有 代码 是 比较 困难 的 。 


12. 表达 式 X=(Y x 4)+3 的 代码 : 
mov eax,Y ; (Y 送 EAX) 
mov ebx,4 ; (Xx 送 EBX) 
imul ebx ; (EAX=EAX "EBX) 
add eax,3 ; (EAX+3 ) 
mov  X,eax ; (EAX 送 X) 

1.2 虚拟 机 概念 


I: 


虚拟 机 概念 : 计算 机 按 层 次 进行 架构 ， 因 此， 每 一 层 都 是 从 较 高 级 指令 集 到 较 低 级 指令 集 
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的 转换 层 。 

2. 翻译 的 程序 通常 更 快 是 因为 它 的 编码 语言 可 以 直接 在 目标 机 器 上 执行 。 而 解释 的 程序 就 不 
是 这 样 的 ， 这 些 程序 在 运行 时 需要 先 翻译 。 

3 次 。 

4. 用 L0 层 专 门 设计 的 程序 将 L1 层 的 程序 整体 转换 为 L0 层 的 程序 。 得 到 的 L0 层 程 序 就 可 
以 直接 在 计算 机 硬件 上 执行 。 

5. 汇编 语言 出 现在 第 3 层 。 

6. Java 虚拟 机 (JVYM) 允许 已 编译 的 Java 程序 在 几乎 所 有 的 计算 机 上 运行 。 

7. 数字 逻辑 、 指 令 集 架 构 、 汇 编 语言 、 高 级 语言 。 

8. 机 器 语言 对 人 类 来 说 难以 理解 ， 因 为 它 不 提供 指令 语法 的 可 视 化 提示 。 

9. 指令 集 架 构 。 

10. 第 2 层 (指令 集 架构 )。 


1.3 ”数据 表示 

1. 最 低 有 效 位 在 位 置 0 上 ， 其 值 为 2 的 0 次 震 。 

2.(a) 248 (b) 202 (c) 240 

3. (a) 00010001 (b) 101000000 (c) 00011110 

4 (a8) 2 (b) 4 (c) 8 (d) 16 
5.(a) 65d 需要 7 位 (b) 409d 需要 9 位 (c) 16 385d 需要 15 位 
6. (a) 35DA (b) CEA3 (c) FEDB 


7.(a) A4693FBC=1010 0100 0110 1001 0011 1111 1011 1100 
(b) B697C7A1=1011 0110 1001 0111 1100 0111 1010 0001 
(c) 2B3D9461=0010 101] 0011 1101 1001 0100 0110 0001 


1.4 布尔 表达 式 


1.(NOTX) ORY 
2.XANDY 

4.F 

3 了 


第 2 章 x86 处 理 器 架构 详解 


2.1 基本 概念 


1. 控制 单元 、 算 术 人 逻辑 单元 和 时 钟 。 

2. 数据 、 地 址 和 控制 总 线 。 

3. 通常 内 存 位 于 CPU 之 外 ， 对 访问 请 求 的 响应 要 更 慢 一 些 。 寄 存 器 则 是 硬 连接 在 CPU 内 。 
4. 取 指 、 译 码 、 执 行 。 

5. 取 内 操作 数 ， 存 内 存 操作 数 。 
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2.2 x86 架构 详解 


1. 实地 址 模式 、 保 护 模 式 和 系统 管理 模式 。 

2. EAX、 EBX、 ECX, EDX、 ESI、 EDI, ESP, EBP, 
.C5 DS, SS ES FS GSs 
4 


2.3 64 位 x86-64 处 理 器 
无 复习 题 。 


2.4 典型 x86 计算 机 组 件 


. SRAM 是 静态 RAM 的 缩写 ， 用 于 CPU 高 速 绥 存 。 

2. VRAM (显存 ) 保存 可 显示 的 图 像 数 据 。 当 使 用 CRT 监视 器 时 ，VRAM 是 双 端 口 的 ， 其 
中 一 个 端口 持续 刷新 显示 器 ， 另 一 个 端口 向 显示 器 写 人 数据 。 

. 可 从 下 面 叙 述 中 任 选 两 个 特性 : ( 1 ) Intel 快速 内 存 访 问 使 用 了 最 新 内 存 控制 单元 (MCH)。 

(2 ) IO 控制 中 心 (Intel ICH8/R/DH) 支持 串 行 ATA 设备 〈 磁 盘 驱 动 器 )。( 3 ) 支持 10 个 

USB 端口 、6 个 PCI Express 插 槽 、 联 网 和 Intel 静音 系统 技术 。( 4 ) 高 清晰 音频 芯片 。 

动态 RAM， 静 态 RAM， 视频 RAM 和 CMOS RAM。 

. 8259A PIC 控制 器 处 理 来 自 键盘 、 系 统 时 钟 和 磁盘 驱动 器 等 硬件 设备 的 外 部 中 断 。 


2.5 输入 一 输出 系统 


. 应 用 程序 层 。 

. BIOS 函数 直接 与 系统 硬件 通信 。 它 们 独立 于 操作 系统 。 

. 编写 BIOS 的 时 候 通 常 不 可 能 预见 到 新 发 明 设备 的 功能 。 

.BIOS 层 。 

. 不 可 能 。 相 同 的 BIOS 适用 于 这 两 种 操作 系统 。 很 多 计算 机 用 户 会 在 同一 台 机 器 上 安装 两 
个 或 三 个 操作 系统 。 他 们 肯定 不 想 在 每 次 重启 计算 机 时 切换 系统 BIOS ! 


第 3 章 汇编 语言 基础 


3.1 基本 语言 元 素 

1. -35d, DDh, 3350, 11011101b 

2. 否 ( 需 要 一 个 前 置 0 )。 

3, 否 (它们 具有 相同 的 优先 级 )。 

4. 表达 式 : 30MOD(3 x 4) + (3-1)/2=20 
5. 实数 常量 : -6.2E+04 

6. 否 ， 它 们 也 可 以 被 包含 在 双 引 号 中 。 
7. 伪 指令 

8. 247 个 字符 


3.2 示例 : 整数 加 减法 
1. ENDP 伪 指 令 标识 了 过 程 的 结束 。 


ULD 一 


ww 人 


n 人 局 一 


2 
3 
4 
3 
3 
1 
2 
3. 
4 
5 
3 
1 
2 
仿 。 
4 
4 
3 


ls 
2 
为 
4. 
6. 


7. SetupESI TEXTEQU <mov esi, OFFSET myArray> 


3. 


第 4 章 数据 传送 、 寻 址 和 算术 运算 


4. 
1. 寄存 器 操作 数 、 立 即 操作 数 和 内 存 操作 数 。 


3. 
4. 


“天 芳 回顾 ”问题 每 类 





. .CODE 伪 指 令 标识 了 代码 段 的 开始 。 


code 和 stack。 


.EAX, 
. INVOKE ExitProcess, 0。 
.3 程序 的 汇编 、 链 接 和 运行 


.目标 (.OBJ) 和 列表 (.LST) 文件 
和 


真 


. 加 载 器 
.可 执行 (.EXE) 文件 


.4 定义 数据 


.Varl SWORD ? 
.Var2 BYTE ? 


var3 SBYTE ? 


.Var4 QWORD ? 
. SDWORD 


.5 ”符号 常量 


BACKSPACE=08h 
SecondsInDay=24*60*60 
ArraySize= ($-myArray) 
ArraySize= ($-myArray) /4 
PROCEDURE TEXTEQU <PROC> 
代码 示例 : 


Sample TEXTEQU < "This is a string"> 


MyString BYTE Sample 


6 64 位 编程 
无 复习 题 。 


1 数据 传送 指令 


假 
假 
真 


3 
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5. 32 位 寄存 器 或 内 存 操 作 数 
6. 16 位 立即 (常数) 操作 数 


4.2 ”加 法 和 减法 


1. inc val2 

2. Sub eax, val3 

3. 代码 : 
mov ax,vald 
sub val2,ax 

4. CF=0, SF=1 

5. OF=1, SF=1 

6. 标志 位 数值 如 下 : 
(a) CF=1，SF=0，ZF=1，OF=0 
(b) CF=0, SF=1, ZF=0, OF=l 
(c) CF=0, SF=1, ZF=0, OF=0 


4.3 ”数据 相关 的 运算 符 和 伪 指 令 


1. 假 
2. 假 
3, 真 
4. 假 
5. 真 


4.4 间接 寻 址 


1. 真 

2. 假 

3. 真 (需要 PTR 运算 符 ) 

4. 真 

5. (a) 10h (b) 40h (c) 003Bh (d) 3 
6. (a) 2010h (b) 003B008Ah (c) 0 (d) 0 


4.5 JMP 和 LOOP 指令 


1 

2. 假 

3. 4 294 967 296 次 

4. 假 

5. 真 

6. CX 

7. ECX 

8. 假 (与 当前 地 址 距离 范围 为 -128 一 +127 字 节 ) 


(e) 3 
(e) 0044h 


附录 C 


(f)2 


“天 芳 回 顾 ” 问 题 从 并 3 


9. 这 里 有 个 小 花招 ! 该 程序 不 会 停止 ， 因 为 第 一 条 LOOP 指令 对 ECX 执行 减 1 操作 ， 使 之 
为 0。 第 二 条 LOOP 指令 对 ECX 执行 减 1 操作 ， 使 之 为 FFFFFFFFh， 从 而 导致 外 层 循环 
重复 执行 。 

10. 将 指令 push ecx 插入 到 标号 L1 处 。 同 时 将 指令 pop ecx 插入 到 第 二 条 LOOP 指令 之 前 。 

(加 入 这 些 指令 后 ，eax 的 最 后 结果 为 1Ch。) 


4.6 64 位 编程 

1. 真 (位 8 一 63 清 零 ) 

2. 假 (允许 64 位 常数 ) 

3. RCX=12345678FFFFFFFFh 
4. RCX=12345678ABABABABh 
5. AL=1Fh 

6. RCX=E002h 


第 5 章 ”过程 


5.1 堆栈 操作 

1. ESP 

2. 运行 时 堆栈 是 唯一 由 CPU 直接 管理 的 堆栈 。 比 如 ， 它 保留 了 被 调用 过 程 的 返回 地 址 。 
3. LIFO 表示 “后 进 先 出 ”。 最 后 人 栈 的 数值 第 一 个 出 栈 。 

4. ESP 减 4。 

S. 真 

6. 假 


5.2 定义 并 使 用 过 程 

人 一 

2. 假 

3. 过 程 结束 后 将 会 继续 执行 ， 很 可 能 进入 另 一 个 过 程 的 开始 。 这 种 编程 错误 通常 难以 被 检 
测 到 。 

4. Receives 表示 过 程 被 调用 时 向 其 传递 的 输入 参数 。Returns 表示 过 程 返回 到 其 调用 者 时 可 
能 产生 的 值 。 

5. 假 (入 栈 的 是 call 指令 后 面 一 条 指令 的 偏 移 量 )。 

6. 真 


5.3 ”链接 到 外 部 库 


1. 假 (其 中 包含 了 目标 代码 )。 
2. 代码 示例 : 


MyProc PROTO 


3. 代码 示例 : 
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call MyProc 


4. Irvine32.lib 
5. Kernel32.dll 为 动态 链接 库 ， 是 MS-Windows 操作 系统 的 基本 组 成 部 分 。 


5.4 Irvine32 链接 库 


. RandomRange 过 程 
. WaitMsg 过 程 
3. 代码 示例 : 


mov eax,700 
call Delay 


iD 一 


. WriteDec 过 程 

. Gotoxy 过 程 

INCLUDE Irvine32.inc 

PROTO 语句 (过程 原型 ) 和 常量 定义 。( 还 有 文本 宏 ， 但 是 其 内 容 不 包含 在 本 章 中 。) 

. ESI 为 数据 初始 地 址 ，ECX 为 数据 单元 个 数 ，EBX 为 数据 单元 大 小 ( 字 节 、 字 或 双 字 )。 
. EDX 为 字 节 数组 的 偏 移 量 ，ECX 为 读 取 字符 的 最 大 个 数 。 

10. 进位 标志 位 、 符 号 标志 位 、 零 标志 位 、 溢 出 标志 位 、 辅 助 进位 标志 位 、 奇 偶 标 志 位 。 
11. 代码 示例 : 


.data 

strl BYTE “Enter identification number: ",0 
idStr BYTE 15 DUP(?) 

.Code 


mov edx,OFFSET strl 

call WriteString 

mov edx,OFFSET idStr 

mov ecx,(SIZEOF idStr) - 1 
call ReadString 


5.5 64 位 汇编 编程 
无 复习 题 。 


第 6 章 条 件 处 理 


6.1 条 件 分 支 
无 复习 题 。 


6.2 布尔 和 比较 指令 


,and ax，00FFh 

.Or ax, OFFOOh 

. XOr eax, OFFFFFFFFh 

.test eax，1 ; 若 eax 为 奇数 则 低位 置 1 
or al, 00100000b 


Wr 


“本 芳 回 厂 ” 问 题 答案 EE 


6. 


CA 上 mb 一 


3 条 件 跳 转 


.JA、JNBE、JAE、JNB、JB、JNAE、JBE、JNA 
.JG、JNLE、JGE、JNL、JL、JNGE、JLE、JNG 
. JB 等 价 于 JNAE。 


JBE 
J 


. 否 (8109h 为 负数 ，26h 为 正 数 )。 


6.4 条 件 循环 指令 


l; 
2 
3. 
4. 


假 
真 
真 
代码 示例 : 


.data 
array SWORD 3,5,14,-3,-6,-1,-10,10,30,40,4 
sentinel SWORD 0 
.Code 
main PROC 
mov esi,OFFSET array 
mov ecx,LENGTHOF array 


next: 
test WORD PTR [esi],8000h ;测试 符号 位 
pushfd ; 标志 位 入 栈 
add esi,TYPE array 
popfd ; 标志 位 出 栈 
loopz next ; 当 ZF=1 时 继续 循环 
jz quit ; 未 发 现 
sub esi,TYPE array ;ESI 指向 数值 


. 如 果 没 有 发 现 匹 配 值 ，ESI 将 以 指向 数组 末尾 之 外 作为 结束 。 若 指向 了 一 个 未 定义 的 内 存 


位 置 ， 那 么 程序 运行 就 可 能 导致 运行 时 错误 。 


6.5 条件 结构 


Ts 


2 


设 本 节 所 有 的 数值 都 是 无 符号 数 。 
代码 示例 : 


cmp ebx,ecx 

jna next 

mov X,1 
next: 


代码 示例 : 


cmp edx,ecx 

jnbe Ll1 

mov X,l 

jmp next 
Ll:s mov X,2 
next: 


. 后 面 表格 的 变化 会 修改 NumberOfEntries 的 值 。 程 序 员 可 能 会 忘记 手动 修改 常数 ， 但 汇编 


器 会 正确 调整 计算 结果 。 
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4. 代码 示例 : 


.data 

sum DWORD 0 

sample DWORD 50 

array DWORD 10,60,20,33,72,89,45,65,72,18 
ArraySize = ($ - Array) / TYPE array 


.code 
mov eax,0 7 和 数 
mov edx,sample 
mov esi,0 ; 索引 


mov ecx,ArraySize 
Ll: cmp esi,ecx 

jn ES 

cmp array[esi*4],edx 

jng L4 

add eax,array[esi*4] 
L4: inc esi 

jmp Ll 
L5: mov sum,eax 


6.6 应 用 : 有 限 状 态 机 

1. 有 向 图 。 

2. 每 个 节点 都 是 一 个 状态 。 

3. 每 条 边 都 表示 由 某 些 输入 引起 的 从 一 个 状态 到 另 一 个 状态 的 转换 。 

4. 状态 C。 

5. 无 限 个 数字 。 

6. FSM 进入 一 个 错误 状态 ， 

7. 否 。 图 中 FSM 允许 有 符号 整数 只 包含 一 个 正 号 (+) 或 负 号 (一 )。6.6.2 节 的 FSM 则 不 
允许 。 


6.7 ”条件 控制 流 伪 指 令 
无 复习 题 。 


第 7 章 整数 算术 运算 


7.1 移 位 和 循环 移 位 指令 


1. ROL 

2.RCR 

3. RCL 

4. 进位 标志 位 接收 了 AX ( 移 位 之 前 ) 的 最 低位 。 

5. 代码 示例 : 
shr axy1 ;AX 移 位 到 进位 标志 位 
recr bx,1 ; 进位 标志 位 移 位 到 BX 

; 使 用 SHRD 


shrd bx,ax,l 
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mov ecx,32 ; 循环 计数 器 

mov bl,0 ; 计算 “i” 的 个 数 
Ll: shr eax,l ; 移 位 到 进位 标志 位 

jnc L2 ; 进位 标志 位 置 1? 

inc bl ; 是 : 位 计数 器 加 1 
L2: loop Li ; 继续 突 环 


; 车 BL 为 奇数 ， 清 除 奇 偶 标 志 位 
; 车 BL 为 偶数 ， 奇 偶 标 志 位 置 1 
shr bl,1 
jc odd 
mov bh,0 
or bh,0 ?PF=1 
jmp next 
odd: 
mov bh,l 
Sr bit ;PF=0 


next: [654 


7.2 移 位 和 循环 移 位 的 应 用 
1. 将 表达 式 分 解 为 (EAX*16 ) + (EAX*8 )。 


mov ebx,eax ; 保存 eax 的 副本 
shl eax,4 ; 乘 以 16 
shl ebx,3 ; 乘 以 8 
add eax,ebx 7 乘积 相 加 
2. 根据 提示 ， 将 乘法 表示 为 (EAX*16 ) + (EAX*4 ) +EAX。 
mov ebx,eax ; 保存 eax 的 副本 
mov ecx,eax ; 保存 eax 的 另 一 个 副本 
shl eax,4 ; 乘 以 16 
shl ebx,2 ; 乘 以 4 
add eax,ebx ; 乘积 相 加 
add eax,ecx ; 加 上 eax 的 初始 值 
3. 将 标号 L1 处 的 指令 修改 为 shr eax，1。 
4. 假设 DX 寄存 器 中 为 时 间 戳 字 : 
shr dx,5 
and dl,00111111b ; 前 置 0 可 选 
mov bMinutes,dl ; 保存 到 变量 


7.3 ”乘法 和 除法 指令 


1. 保存 乘积 的 寄存 器 大 小 是 乘 数 和 被 乘 数 大 小 的 两 倍 。 比 如 ， 计 算 0FFh 乘 以 0FFh， 则 乘 
积 (FE01h) 很 容易 就 扩展 到 16 位 。 

2. 当 相 乘 结果 正好 可 以 完全 存放 在 乘积 的 低位 寄存 器 时 ，IMUL 对 乘积 符号 扩展 到 高 位 乘积 
寄存 器 。 而 MUL 则 对 乘积 进行 全 零 扩 展 。 

3. 对 IMUL 来 说 ， 若 乘积 的 高 半 部 分 不 是 其 低 半 部 分 的 符号 扩展 ， 那 么 进位 标志 位 和 溢出 
标志 位 置 1。 

4. EAX 

5. AX 
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a 


AX 

. 代码 示例 : 

mov ax,dividendLow 

cwd ; 被 除数 符号 扩展 
mov bx,divisor 

idiv bx 


- 


7.4 扩展 加 减法 


.ADC 指令 将 目的 操作 数 与 源 操作 数 和 进位 标志 位 相 加 。 
.SBB 指令 将 目的 操作 数 减 去 源 操作 数 和 进位 标志 位 。 
.EAX=C0000000h，EDX=00000010h 

. EAX=F0000000h, EDX=000000FFh 

DX=0016h 


tn 上 mb 一 


7.5 ASCII 和 非 压缩 十 进 制 运算 
. 代码 示例 : 
or ax,3030h 
代码 示例 : 
and ax,0FOFh 
. 代码 示例 : 
and ax,OFOFh ; 转换 为 非 压缩 形式 


aad 


jh 


LoD 


4. 代码 示例 : 


aam 


7.6 ”压缩 十 进 制 运算 
. 当 压 缩 十 进 制 加 法 的 和 数 大 于 99 时 ，DAA 将 进位 标志 位 置 1。 例 如 ， 


) 一 


第 8 章 高 级 过 程 


8.1 引言 


无 复习 题 。 


附录 C 


mov al,56h 
add al,92h ; AL = E8h 
daa ; AL = 48h, CF=1 
2. 若 从 小 的 压缩 十 进 制 整数 中 减 去 大 的 压缩 十 进 制 整数 ， 则 DAS 将 进位 标志 位 置 1。 例 如 
mov al,56h 
sub al,92h ;AL = C4h 
das ; AL = 64h, CF=1 
3.7ti 个 学 节 。 
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8.2 ”堆栈 帧 


1. 真 
2. 真 
3; 真 
4. 假 
5. 真 
6. 真 
7. 值 参数 和 引用 参数 


8.3 递归 


1. 假 
2. 终止 条 件 为 n 等 于 零 。 
3. 每 次 递归 调用 结束 后 需 执行 如 下 指令 : 
ReturnFact: 
mov ebx,[ebp+8] 
mul ebx 
L2: pop ebp 
ret 4 
4. 计算 会 超出 一 个 无 符号 双 字 的 范围 ， 结 果 绕 回 过 0。 因 此 输出 将 会 小 于 12 ! 。 
5. 12 ! 需要 156 字 节 的 堆栈 空间 。 理 由 : 当 m=-0 时 ， 使 用 了 12 个 堆栈 字 节 (3 个 堆栈 项 ， 
每 个 都 为 4 字 节 )。 当 n=1 时 ,使 用 了 24 个 堆栈 字 节 。 当 n=2 时 ， 使 用 了 36 个 堆栈 字 
节 。 因 此 ,，n! 使 用 的 地 址 空间 总 数 为 (n+1 ) x 12。 


8.4 INVOKE、ADDR、PROC 和 PROTO 


1. 真 
2. 假 
3. 假 
4. 真 
8.5 ”新建 多 模块 程序 


1; 真 
2. 假 
3. 真 
4. 假 
8.6 ”参数 的 高 级 用 法 


无 复习 题 。 


8.7 Java 字 节 码 
无 复习 题 。 
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第 9 章 字符 串 和 数组 


9.1 引言 
无 复习 题 。 


9.2 字符 串 基 本 指令 
1. EAX 

2. SCASD 

3. EDI 

4.LODSW 

5. ZF=1 时 重复 


9.3 ”部 分 字符 串 过 程 


1. 假 (达到 较 短 字 符 串 的 空 终止 符 时 过 程 停止 ) 
世嘉 
3. 假 
4. 假 


9.4 二 维 数组 


1. 任意 32 位 通用 寄存 器 。 
2..16。 
3. 不 可 以 。 要 保留 EBP 作为 当前 过 程 堆栈 帧 的 基 址 指针 。 


9.5 ”整数 数组 的 检索 和 排序 


1.n 一 1 次 

2.n 一 1 次 

3. 否 。 每 次 都 要 减 1。 
4. T(5000)=0.5 x 10 秒 


9.6 Java 字 节 码 : 字符 串 处 理 ( 可 选 主题 ) 
无 复习 题 。 


第 10 章 结构 和 宏 


10.1 结构 


. templ MyStruct <> 
. temp2 MyStruct <0> 
temp3 MyStruct <, 20 DUP(0)> 


array MyStruct 20 DUP(<>) 


wm 


mov ax,array.fieldl 


及 有 录 C 
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6. 代码 示例 : 

mov esi,OFFSET array 

add esi,3 * (TYPE myStruct) 

mov (MyStruct PTR[Iesi]).fieldl.ax 
:32 
8. 82 


9. TYPE MyStruct .field2 (或 : SIZEOF Mystruct.field2 ) 
10.2 安 


1. 假 
2. 真 
3. 带 参数 的 宏 更 容易 重用 。 
4. 假 
5 页 
6. 假 


10.3 ”条件 汇编 伪 指令 


1. IFB 伪 指 令 用 于 检查 空 安 参 数 。 

2. IFIDN 伪 指 令 比 较 两 个 文本 值 ， 若 两 者 相等 ， 则 返回 真 。 其 执行 的 比较 需 区 分 大 小 写 。 
3. EXITM 

4. IFIDNI 与 IFIDN 相同 ， 但 不 区 分 大 小 写 。 

5. 若 符号 已 定义 ， 则 IFDEF 返回 真 。 


10.4 定义 重复 语句 块 


1. WHILE 伪 指 令 根据 布尔 表达 式 来 重复 语句 块 。 
2.REPEAT 伪 指 令 根据 计数 值 来 重复 语句 块 。 

3. FOR 伪 指 令 通过 遍历 符号 列表 来 重复 语句 块 。 
4. FORC 伪 指 令 通过 遍历 字符 串 来 重复 语句 块 。 
5. FORC 

6. 代码 示例 : 

BYTE 0,0,0,100 


BYTE 0,0,0,20 
BYTE 0,0,0,30 


. 代码 示例 : 


mRepeat MACRO 'X',50 
mov cx,50 
?2?0000: mov ah,2 
toy QL ‘XX 
ps 翅 攻 


loop ??0000 
mRepeat MACRO AL,20 

mov cx,20 
?30001: mov ah,2 


~ 
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mov dl,AL 
nt “21k 
loop ??0001 


mRepeat MACRO byteVal,countVal 


mov cx,countVval 


?2?30002: mov ah,2 


mov dl,byteVal 


int 21h 
loop ??0002 


8. 若 检 查 (列表 文件 中 的 ) 链表 数据 ， 
00000008 (第 二 个 节点 的 地 址 ): 


Offset ListNode 


00000000 00000001 
00000008 
00000008 00000002 
00000008 
00000010 00000003 
00000008 
00000018 00000004 
00000008 
00000020 00000005 
00000008 
00000028 00000006 
00000008 


NodeData 
NextPtr 
NodeData 
NextPtr 
NodeData 
NextPtr 
NodeData 
NextPtr 
NodeData 
NextPtr 
NodeData 
NextPtr 


府 录 C 


会 发 现 ， 很 明显 每 个 ListNode 的 NextPtr 域 都 等 于 


“ 表 中 第 一 节点 的 地 址 计数 器 的 值 ($) 保持 固定 ”就 暗示 了 这 个 特点 。 


第 11 章 MS-Windows 编程 


11.1 Win32 控制 台 编程 
1. /SUBSYSTEM: CONSOLE 


2. 真 
3. 假 
4. 假 
5. 真 


11.2 编写 图 形 化 的 Windows 应 用 程序 
注意 : 本 节 大 多 数 习题 都 可 以 查阅 GraphWin.inc 来 解决 ， 本 书 示 例 程序 中 提供 了 该 头 


文件 。 


1. POINT 结构 有 两 个 域 ，ptX 和 ptY，, 说 明 屏 幕 上 点 的 X 坐标 和 YY 坐标 (以 像素 为 单位 )。 

2. WNDCLASS 结构 定义 窗口 类 。 程 序 中 的 每 个 窗口 都 必须 属于 一 个 类 ， 且 每 个 程序 都 必须 
为 其 主 窗 口 定 义 一 个 窗口 类 。 在 显示 主 窗口 前 ， 要 在 操作 系统 中 注册 这 个 类 。 

3. lpfnWndProc 是 应 用 程序 的 函数 指针 ， 用 于 接收 和 处 理 用 户 触发 的 事件 消息 。 

4. style 域 是 由 不 同样 式 选 项 组 合 而 成 的 ， 如 WS_CAPTION 和 WS_BORDER， 用 于 控制 窗 


口 的 外 观 和 行为 。 


5. hInstance 为 当前 程序 实例 的 句柄 。 运 行 于 MS-Windows 的 每 个 程序 ， 在 其 被 加 载 到 内 存 
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时 ， 由 操作 系统 自动 分 配 一 个 句柄 。 


11.3 ”动态 内 存 分 配 

1. 动态 内 存 分 配 

2. 用 EAX 为 程序 现 有 堆 返 回 一 个 32 位 整数 句柄 。 
3. 从 堆 中 分 配 一 个 内 存 块 。 

4. HeapCreate 示例 : 


HEAP_ START = 2000000 2 MB 
HEAP MAX = 400000000 ; 400 MB 
.data 

hHeap HANDLE ? ; 推 句柄 


,code 
INVOKE HeapCreate, 0, HEAP START, HEAP MAX 


5. (与 堆 句柄 一 起 ) 传递 内 存 块 指针 。 
11.4 x86 内 存 管理 


1.(a) 多 任务 允许 同时 运行 多 个 程序 (或 任务 )。 处 理 器 将 其 时 间 分 割 给 所 有 的 运行 
程序 。 
(b) 分 段 是 指 隔离 内 存 段 与 内 存 段 的 方法 。 它 使 得 多 个 程序 能 同时 运行 且 不 会 相互 
干扰 。 
2. (a) 段 选择 符 是 保存 在 段 寄存 器 (CS、DS、SS、ES、FS 或 GS) 中 的 16 位 值 。 
(b) 逻辑 地 址 是 段 选 择 符 与 32 位 偏 移 量 的 组 合 。 
3. 真 
4. 真 
5. 假 
6. 假 


第 12 章 浮 点 数 处 理 与 指令 编码 


12.1 浮 点 数 二 进 制 表示 


1. 因为 -127 的 倒数 为 +127， 将 会 产生 溢出 。 

2. 因为 +128 加 上 阶 码 偏 移 量 ( 127 ) 得 到 的 是 负数 。 
3. 52 位 

4.8 位 


12.2 浮 点 单元 


1.fldst (0) 

2. R0 

3. 寄存 器 选择 范围 : 操作 码 、 控 制 、 状 态 、 标 签字 、 最 后 指令 指针 、 最 后 数据 指针 。 
4.BCD 码 

5. 没有 。 
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12.3 x86 指令 编码 


1. (a) 8E (b) 8B (c) 8A (d) 8A (e) A2 (f) A3 
2. (a) D8 (b) D3 (c) ID (d) 44 (e) 84 (f) 85 


第 13 章 高 级 语言 接口 


13.1 引言 


1. 语言 的 命名 规范 是 指 变 量 或 过 程 命名 的 相关 规则 和 特性 。 
2. 微 模式 、 小 模式 、 紧 凑 模 式 、 中 模式 、 大 模式 、 巨 模式 
3. 不 可 以 ， 因 为 链接 器 无 法 找到 过 程 名 。 


13.2 ”内 肉 汇 编 代码 


1. 内 嵌 汇 编 代码 是 将 汇编 语言 源 代码 直接 插入 高 级 语言 程序 。 反 之 ，C++ 中 的 内 符 限 定 符 
则 要 求 C++ 编译 器 直接 把 函数 体 插入 程序 的 编译 代码 ， 以 便 消除 函数 调用 和 返回 所 耗费 
的 额外 执行 时 间 。( 注 意 : 回答 这 个 问题 需要 用 到 本 书 并 未 涉及 的 一 些 C++ 语言 知识 。) 

2. 编写 内 嵌 代 码 的 最 大 优点 就 是 简单 ， 因 为 它 没有 外 部 链接 问题 ,命名 问题 ， 也 不 用 考虑 参 
数 传递 协议 。 其 次 ， 内 藤 代 码 执行 速度 更 快 ， 因 为 它 避 免 了 汇编 语言 过 程 调用 和 返回 通常 
所 需要 的 额外 执行 时 间 。 

3. 注释 示例 〈 任 选 两 个 ): 


mov esi,buf ; initialize index register 

mov esi,buf // initialize index register 

mov esi,buf /* initialize index register */ 
4. 是 


13.3 32 位 汇编 语言 代码 与 C/C++ 的 链接 
1. 必须 使 用 关键 字 extern 和 “C” 。 


2. Irvine32 链接 库 使 用 STDCALL， 它 与 C 和 C++ 使 用 的 C 调用 规范 不 同 。 其 重点 差异 是 


函数 调用 后 清除 堆栈 的 方法 。 
3. 通常 在 函数 返回 前 ， 浮 点 数 会 被 压 人 处 理 器 的 浮 点 堆栈 。 


4. 用 AX 寄存 器 返回 。 


索 


引 


索引 中 的 页 码 为 英文 原 书页 码 ， 与 书 中 页 边 标注 的 页 码 一 致 


A 


__asm Direcitive (_asm 伪 指 令 ) (Visual C++)，564- 
566 
AAA (加 法 后 ASCII 调整 ) 指令 ，274，280 
AAD (除法 前 ASCII 调整 ) 指令 ，276，280 
AAM (乘法 后 ASCII 调整 ) 指令 ，276，280 
AAS (减法 后 ASCII 调整 ) 指令 ，276，280 
ADC ( 带 进位 加 法 ) 指令 ，269-270，280 
ADD 指令 ，105-106，109，112 
AddTwo program (AddTwo 程序 )，63-64 
adding a variable (添加 一 个 变量 )，75-76 
listing file for (列表 文件 )，71-73 
running and debugging (运行 和 调试 )，65-70 
64-bit programming ( 64 位 编程 )，88-90 
Addition and subtraction (加 法 和 减法 )，105-112 
ADD instruction (ADD 指令 )，105-106 
arithmetic expressions, implementing( 算 术 表达 式 ， 
实现 )，106-107 
example program (示例 程 序 )(AddSub Test)，111 
flags affected by( 受 影响 的 标志 位 )，107-110 
INC and DEC instruction (INC 和 DEC 指令 )， 
105 
NEG instruction (NEG 指令 )，106 
SUB instruction (SUB 指令 )，106 
Addidon test (加 法 测试 )，110 
Address bus (地 址 总 线 )，34 
Address space (地 址 空间 )，38 
ADDR operator (ADDR 运算 符 )，312 
AddTWO procedure (AddTwo 过 程 )，293，314， 
336 
Advanced Micro Devices (高 级 微 设备 ) (AMD) 
Athlon，33 
Advanced procedures (高 级 过 程 )，286-347 
recursion (递归 )，302-311 
stack frames (堆栈 帧 )，287-302 
ALIGN directive (ALIGN 伪 指 令 )，113-114 


AllocConsole function (AllocConsole 函数 )，450 
American National Standards Institute (美国 国家 标 
准 协会 )(ANSI)，19 
American Standard Code for Information Interchange 
(美国 标准 信息 交换 码 )， 参 见 ASCII 
AND instruction (AND 指令 )，191-192 
AND (boolean operator)( 布 尔 运算 符 )，22-23 
Application Programming Interface (应 用 编程 接口 ) 
(API)，47，179，445 
Arithmetic expressions, implementing (算术 表达 式 ， 
实现 )，106-107，267-268 
Arithmetic instructions (算术 运算 指令 )，526-530 
Arithmetic logic unit (ALU)( 算 术 逻 辑 单 元 )，33 
Arithmetic operators (算术 运算 符 )，56 
Arithmetic shifts versus logical shifts (算术 移 位 与 逻 
辑 移 位 )，243-244 
ArrayFill procedure (ArrayFill 过 程 )，297 
ArraySum, 150-151 
procedure (过 程 )，151-152，317，319，556 
program (程序 )，315 
Arrays (数组 ) 
calculadng the Sizes，( 计 算 大 小 )，85-86 
indirect operands (间接 操作 数 )，117-118 
looping through (循环 )，395 
The Arf of Computer programming( Knuth)《 计 算 机 
程序 设计 艺术 》(Knuth),，2 
ASCII, 19 
control characters (控制 字符 )，20，14-9 
decimal and unpacked decimal (十 进 制 和 非 压 缩 
十 进 制 )，274 
string (字符 串 )，20 
unpacked decimal arithmetic and ( 非 压 缩 十 进 制 
算术 运算 )，273-277 
askForInteger function (askForInteger 函数 )，574 
Assemble-link-execute cycle (汇编 一 链接 - 执行 周 
期 )，71 
Assemblers (汇编 器 )，2，71 


528 


过 1 


Assembly code( 汇 编 代码 )，215-216 
generating (生成 )，215 
versus compiler optimization (与 编译 优化 )，565 
versus nonoptimized C++ code (与 非 优 化 C++ 代 
码 )，569 
Assembly language (汇编 语言 ) 1-9，26，33， 
49，53-94 
access levels (访问 层次 )，49 
applications of (应 用 )，5-6 
definition (定义 )，2 
elements of (元 素 )，54-63 
high-level languages and (高 级 语言 )，6 
to optimize C++ code (优化 C++ 代码 )，565 
reasons for learning (学 习 的 理由 )，5 
Teladonship between machine and (与 机 器 之 间 的 
关系 )，4 
Assembly language module (汇编 语言 模块 )，574- 
573 
Auxiliary carry flag(AC) (辅助 进位 标志 位 )，41， 
107, 283 


B 


Base address《〈 基 址 )，503 
Base-index-displacement operands ( 基 址 - 变 址 - 
偏 移 量 操作 数 )，371-372 
Base-index operands ( 基 址 - 变 址 操作 数 )，369- 
371 
calculating a Row Sum (计算 一 行 的 和 数 )，370- 
371 
scale factors (比例 因子 )，371 
two-dimensional array (二 维 数组 )，372 
Base-offset addressing( 基 址 - 偏 移 量 寻 址 )，291 
Basic Input-Output Sysrem (基本 输入 -输出 系统 ) 
(BIOS)，44，47，16.2 
Binary addition (二 进 制 加 法 )，12 
Binary bits ，displaying (二 进 制 位 ， 显 示 )，168 
Binary bits ，creating (二 进 制 文件 ， 创 建 )，14.30- 
14.33 
Binary floating-point numbers，normalized (二 进 制 
浮 点 数 ， 规 范 化 )，514 
Binary integer (二 进 制 整数 )，9 
Signed (有 符号 )，10 
translating unsigned binary integers to decimal (无 


符号 二 进 制 整数 转换 为 十 进 制 )，11 
translating unsigned decimal integers to binary (无 
符号 十 进 制 整数 转换 为 二 进 制 )，11-12 
unsigned (无 符号 )，10 
Binary multiplication (二 进 制 乘法 )，253 
Binary subtraction (二 进 制 减法 )，18-19 
Binary reals，converting decimal fraction to (二 进 制 
实数 ， 将 十 进 制 小 数 转换 为 )，516-518 
Binary search algorithm (对 半 查 找 算法 )，375-376 
test program for (测试 程序 )，378-382 
BIOS(Basic Input-Output SySrem) (基本 输入 一 输出 
系统 )，44，47，16.2 
Bit-mapped sets (位 映射 集 )，194-195 
Bit masking (位 屏蔽 )，192 
Bit strings (位 串 )，254 
Bitwise instructions ( 按 位 指令 )，232 
Block comments ( 块 注释 )，62 
Block-structured IF statements ( 块 结 构 的 正 语句 )， 
210-213 
Boolean algebra (布尔 代数 )，22 
Boolean and comparison instructions (布尔 和 比较 指 
令 )，190-199 
AND instruction (AND 指令 )，191-192 
bit-mapped sets( 位 映射 集 )，194-195 
CMP instruction (CMP 指令 )，197-198 
CPU flags (CPU 标志 )，191 
NOT instruction (NOT 指令 )，196 
OR instruction (OR 指令 )，192-193 
setting and clearing individual CPU flags (设置 和 
清除 单个 CPU 标志 )，198-199 
in 64-bit mode ( 64 位 模式 )，199 
TEST instruction (TEST 指令 )，196-197 
XOR instruction (XOR 指令 )，195-196 
Boolean expression (布尔 表 达 式 )，22-26，423 
Boolean operations (布尔 操作 )，22-26 
bool eanexpression (布尔 表达 式 )，22-24 
bool operations，truth tables for (布尔 操作 ， 真 
值 表 )，24-26 
operator precedence (运算 符 优先 级 )，24 
Branching instructions (分 支 指令 )，341 
.BREAK condition (.BREAK 条 件 )，225 
Brink, James, 322,，533 
Bubble sort( 冒 泡 排序 )，373-375 
assembly language (汇编 语言 )，375 
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pseudocode ( 伪 代 码 )，374-375 

test program (测试 程序 )，378-382 
BubbleSort procedure (BubbleSort 过 程 )，300 
Bus (总 线 )，45 
BYTE, 76-78 
Byte ( 字 节 )，77 


C++ 5 
assembly language，( 汇 编 语 言 )，4 
module (模块 )，567-568 
startup program (启动 程序 )，567，581 
stub module( 根 模块 )，582 
Cache memory (高 速 缓冲 存储 器 )，36 
CalcSum procedure (CalcSum 过 程 )，303 
Caling convention (调用 规范 )，556 
CALL instruction ( CALL 指令 )，147-148，153-154， 
174，177 
C and C++ compilers (C 和 C++ 编译 器 )，559 
C and C++ funcdons，calling (C 和 C++ 函数 ， 调 
用 )，574 
assembly language module (汇编 语言 模块 )，574- 
S15 
function prototypes (函数 原型 )，574 
function return values ( 函数 返回 值 )，575 
Carry flag (进位 标志 位 )，40，106 
addidon and (加 法 )，107-108 
subtraction and (减法 )，108 
CBW (convert byte to word) instruction ( 字 节 转换 
为 字 指令 )，264 
C language calling convention (C 语言 调用 规范 )， 
3y7 
CDQ (convert doubleword to quadword) instruction 
( 双 字 转换 为 四 字 指 令 )，265，280 
Central Processor Unit, (CPU), in microcomputer (中 
央 处 理 器 单元 ， 微 计算 机 内 )，34 
Character constant 字符 常数 ，57-58 
Character set 字符 集 ，19 
Character storage 字符 存储 ，19-21 
Chipset，motherboard 芯片 组 ， 主 板 ，45-46 
C language specifier (C 语言 说 明 符 )，559 
C library functions，calling (C 库 函数 ， 调 用 )， 
579-581 
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Clock (时 钟 )，33-34 
Clock cycle (时 钟 周期 )，34 
Close file handle(3Eh) (关闭 文件 句柄 ) (3Eh)， 
14.23 
CloseFile procedure (CloseFile 过 程 )，158 . 
CloseHandle function (CloseHandle 函数 )，466 
Cirscr procedure (Clrscr 过 程 )，159，171 
CMOS RAM, 44, 46, 50 
CMP instruction (CMP 指令 )，197-198 
CMPSB instmction (CMPSB 指令 )，355 
CMPSD instruction (CMPSD 指令 )，355 
CMPSW instruction (CMPSW 指令 )，355 
.CODE direcdve (.CODE 伪 指 令 )，59，65 
Code examples (代码 示例 ) 
array dot product (数组 点 积 )，536 
expression (表达 式 )，535-536 
sum of an array (数值 之 和 )，536 
sum of square roots (平方 根 之 和 )，536 
Code label (代码 标号 )，60 
Code segment (代码 段 )，55，72 
Command processor (命令 处 理 程序 )，14.2-14.3 
Command tail，MS-DOS ( 命 令 尾 )，MS-DOS， 
14.27-14.30 
Comments (注释 )，62 
Comparison instructions (比较 指令 )，341 
Compiler-generated code (编译 器 生成 的 代码 )， 
559-563 
Complex instruction Set Computer (CISC) design ( 复 
杂 指 令 集 计算 机 设计 )，539 
Compound expresssions (复合 表达 式 )，213-216， 
228-231 
Conditional and loop instructions( 条 件 和 循环 指令 )， 
209-210 
LOOPE (loop if equal) instruction (相等 则 循环 指 
令 )，209 
LOOPNE (loop if not equal) instructions (不 相等 
则 循环 指令 )，209 
LOOPNZ (loop if not zero) instruction (不 为 0 则 
循环 指令 )，209 
LOOPZ (loop if zero) instruction (为 0 则 循环 指 
令 )，209 
Conditional-assembly directives (条 件 汇 编 伪 指令 )， 
420-433 
boolean expressions (布尔 表达 式 )，423 
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default argument initializers (默认 参数 初始 值 设 
定 )，422-423 
IF, ELSE, and ENDIF directives (IF、ELSE 和 
ENDIF 伪 指 令 )，423-424 
IFIDN and IFIDNI directive ( IFIDN，IFIDNI 伪 
指令 )，424-425 
macro functions ( 宏 函 数 )，431-433 
missing arguments，checking for (缺失 参数 ， 检 
查 )，421-422 
special operators (特殊 运算 符 )，428-431 
Conditional branching (条 件 分 支 )，190 
Conditional control flow directives (条 件 控制 流 伪 
指令 )，225-232 
compound expressions (复合 表达 式 )，228-231 
IF statements，creating (JF 语句， 新 建 )，226- 
227 
.REPEAT and .WHILE directives ( .REPEAT 和 
.WHILE 伪 指 令 )，231-232 
signed and unsigned comparisons (有 符号 数 和 无 
符号 数 比较 )，227-228 
Conditional jump (条 件 跳 转 )，199-208 
applications (应 用 )，204-208 
conditional structures (条 件 结构 )，199-200 
Jcond instructions (Jcond 指令 )，200-201- 
types of (类 型 )，201-204 
Conditional structures (条 件 结构 )，210-219 
block-structured IF statements( 块 结构 的 下 语句 )， 
210-213 
compound expressions (复合 表达 式 )，213-214 
definition (定义 )，210 
WHILE loops (WHILE 循环 )，214-216 
Conditional transfer (条 件 转移 )，123 
Conditional codes (floating point) (条 件 码 ( 浮 点 
数 ))，530-531 
Console input (控制 台 输入 )，455-461 
console input buffer (控制 台 输 入 缓冲 区 )，455- 
459 
getting keyboard state (获得 键盘 状态 )，460-461 
single-character input (单字 符 输入 )，459-460 
Console output (控制 台 输 出 )，461-463 
data structures (数据 结构 )，461-462 
WriteConsole function ( WriteConsole 郴 数 )， 
462-463 
WriteConsoleOutputCharacter function ( Write- 
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ConsoleOutputCharacter 函数 )，463 
Console Window (控制 台 窗口 )，157，473 
.CONTINUE directive(.CONTINUE 伪 指令 )，225 
Control bus (控制 总 线 )，33-34，36 
Control flags (控制 标志 )，40 
Control unit (CU) (控制 单元 (CU))，33 
COORD structure (COORD 结构 )，391，438，461 
Copying a string (复制 字符 串 )，127-128 
CPU flags (CPU 标志 )，104，201，14.33 

display in Visual Studio Debugger ( 在 Visual 

Studio 调试 器 中 显示 )，104 

CreateConsoleScreenBuffer function (CreateConsole- 
ScreenBuffer 函数 )，450 

CreateFile function (CreateFile 函数 )，463 

CreateFile parameters (CreateFile 参数 )，464 

CreateFile program example ( CreateFile 程序 示例 )， 
470-471 

Create or open file (716Ch) (新 建 或 打开 文件 )， 
14.22-14.23 

CreateOutputFile procedure (CreateOutputFile 过 程 )， 
159 

Crlf procedure (Crlf 过 程 )，159 

CR/LF (Carriage-return line-feed) ( CR/LF ( 回 车 换 
行 符 ))，78 

Current location counter (当前 地 址 计数 器 )，85 

CWD (Convert word to doubleword) instruction ( 字 
转换 为 双 字 指 令 )，264 
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DAA (decimal adjust after addition) instruction ( 加 
法 后 十 进 制 调整 指令 )，277-278 
DAS (decimal adjust after subtraction) instruction ( 减 
法 后 十 进 制 调整 指令 )，279 
Data bus (数据 总 线 )，33-35 
Data definition statement (数据 定义 语句 )，74-75 
BYTE and SBYTE data (BYTE 和 SBYTE 数据 )， 
74 
data types in (数据 类 型 )，74-75 
defining strings (定义 字符 串 )，77-78 
DUP operator DWORD and SDWORD data ( DUP 
运算 符 DWORD 和 SDWORD 数据 ), 78-79 
initializer (初始 值 )，75 
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little endian order (小 端 顺序 )，82-83 
multiple initializers (多 初始 值 )，77 
packed binary coded decimal (BCD) (压缩 二 进 制 
编码 的 十 进 制 数 (BCD))，80 
real number data (实数 数据 )，81 
WORD and SWORD data (WORD 和 SWORD 数 
据 )，74-75 
.DATA directive (.DATA 伪 指 令 )，59，83 
Data label (数据 标号 )，60 
Data-related operators and directives (数据 相关 的 运 
算 符 和 伪 指令 )，112-117 
align directive (ALIGN 伪 指 令 )，113-114 
offset operator (OFFSET 运算 符 )，112-113 
Data representation (数据 表 示 )，9-21 
binary addition (二进制 加 法 )，12 
binary integers (二 进 制 整数 )，11-12 
character storage (字符 存储 )，19-21 
hexadecimal integers (十 六 进 制 整数 )，13-15 
integer storage sizes (整数 存储 大 小 )，13 
signed integers (有 符号 整数 )，16-19 
Data segment (数据 段 )，55，77，83，90 
Data transfer (数据 传送 )，96-132 
direct memory operands (直接 内 存 操作 数 )，96- 
97 
direct-offset operands (直接 - 偏 移 量 操 作 数 )， 
102-103 
example program (示例 程序 )，103-104 
LAHF and SAHF instructions (LAHF 和 SAHF 指 
令 )，101 
MOY instruction (MOYV 指令 )，98-99 
operand types (操作 数 类 型 )，96 
XCHG instruction (XCHG 指令 )，102 
Zero/sign extension of integers (整数 全 零 / 符 号 
扩展 )，99-101 
Debugger (调试 器 )，15，54 
Debugging tips( 调 试 提示 ) 
argument size mismatch (参数 大 小 不 匹配 )，321 
passing immediate values (传递 立即 数 )，321-322 
passing wrong type of pointer (传递 错误 的 指针 类 
型 )，321 
Decimal real (十 进 制 实数 )，57 
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Declaring and using unions (声明 和 使 用 联合 )， 
403-405 
declaring and using union variables (声明 和 使 用 
联合 变量 )，404-405 
structure containing union (结构 包含 联合 )，404 
Default argument initializers (默认 参数 初始 值 设 
定 )，422 
Delay procedure (Delay 过 程 )，159 
Descriptor table (描述 符 表 )，37，40，502 
Destination operand (目的 操作 数 )，61，98 
Device drivers (设备 驱动 程序 )，5，47-48 
Direct addressing (直接 寻 址 )，117 
Directed graph (有 向 图 )，219 
Direction flags (方向 标志 )，40，69，354 
Directives ( 伪 指令 )，59 
Direct memory operands〈 直 接 内 存 操作 数 )，96-97 
Direct-offset operands (直接 - 偏 移 量 操作 数 )， 
102-103 
Directory listing program (目录 表 程 序 ) 
ASM module (ASM 模块 )，582-583 
C++ stub module (C++ 根 模块 )，582 
DisplaySum procedure ( DisplaySum 过 程 )，328， 
332 
Display_Sum procedure (Display_Sum 过 程 )，271 
DIV instruction (DIV 指令 )，262-264 
Doubleword (4bytes) ( 双 字 (4 字 节 ))，13，593， 
601 
DRAM, See Dynamic random-access memory (DRAM) 
(DRAM， 参 见 动态 随机 访问 存储 器 
(DRAM)) 
“Drunkard'S Walk"” exercise，(“ 醉 汉 行走 ”练习 )， 
399 
DumpMem procedure (DumpMem 过 程 )，159，171， 
178, 349, 413 
DumpRegs procedure (DumpRegs 过 程 )，160，178 
DUP operator (DUP 运算 符 )，78-79，85，91 
DWORD，74，79 
Dynamic link library (动态 链接 库 )，154 
Dynamic memory allocation (动态 内 存 分 配 )，492- 
499 
Dynamic random-access memory (DRAM) (动态 随 
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机 访问 存储 器 )，46 
E 


EBP register (EBP 寄存 器 )，290 
ECHO directive (ECHO 伪 指 令 )，409 
EFLAGS register (EFLAGS 寄存 器 )，40，44 
.ELSE directive (.ELSE 伪 指 令 )，225，423 
.ELSEIF condition (.ELSEIF 条 件 )，225，226 
Embedded programs (媒人 式 程序 )，5 
Encoded reals (编码 实数 )，55，57 
END directive marks (END 伪 指 令 标记 )，65 
.ENDIF directive ( .ENDIF 伪 指 令 )，225，226， 
233 423 
ENDP directive marks (ENDP 伪 指 令 标记 )，65 
.ENDW directive (.ENDW 伪 指 令 )，225 
ENTER instructions (ENTER 指令 )，298-300 
EPROM. See Erasable programmable read-only memory 
(EPROMJ) ( EPROM ， 参 见 可 控 除 可 编程 只 
读 存 储 器 ) 
Equal-sign directive (等 号 伪 指令 )，84-85 
EQU directive (EQU 伪 指 令 )，86-87 
Erasable programmable read-only memory (EPROM) 
(可 擦 除 可 编程 只 读 存储 器 )，46 
ErrorHandler procedure (ErrorHandler 过 程 )，488 
Exception synchronization (异常 同步 )，534-535 
Executable file (可 执行 文件 )，71 
EXITM (exit macro) directive (退出 宏 伪 指令 )，421 
ExitProcess function (ExitProcess 函数 )，64 
Expansion operator(%) (展开 运算 符 (%))，429- 
430 
Explicit stack parameters ( 显 式 堆栈 参数 )，291 
Extended addition and subtraction (扩展 加 法 和 减 
法 )。269-273 
ADC instruction (ADC 指令 )，269-270 
extended addition example (扩展 加 法 示例 )，270- 
272 
SBB instruction (SBB 指令 )，272 
Extended addition example (扩展 加 法 示例 )，270- 
ZX2 
Extended Add procedure ( Extended Add 过 程 )， 
270-271 
Extended Physical Addressing (扩展 物理 寻 址 )，38 
External identifiers (外 部 标识 符 )，556 


Extemal libraty，1linking to (外 部 链接 库 ， 链 接 )， 
153-155 

EXTERNDEF directive (EXTERNDEF 伪 指 令 )， 
325 

EXTERN directive (EXTERN 伪 指 令 )，323-326 
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FABS(absolute value) instruction (FABS (绝对 值 ) 
指令 )，527 
Factorial ，calculating (阶乘 ， 计 算 )，304-310 
Factorial procedure (Factorial 过 程 )，305-306，308 
FADD (add) instruction (加 法 指令 )，526-527 
FADDP (add with pop) instmuction ( 相 加 并 出 栈 指 
令 )，526-527 
Fast division (SHR) (快速 除法 (SHR))，246 
Fast multiplication (SHL) (快速 乘法 )，251 
FCHS (change sign) instruction (符号 改变 指令 )， 
526-527 
FCOM (compare floating-point values) instructions 
(比较 浮 点 数 指令 )，530-533 
FDIV instruction (FDIV 指令 )，526，529-530 
FIADD (add integer) instruction (加 整数 指令 )， 
526-527 
Fibonacci Generator ( 斐 波 那 契 生成 器 )，188 
Field initializers (字段 初始 值 )，391-392 
FILD (load integen instructions (加 载 整数 指令 )， 
525 
File/device handles (文件 /设备 句柄 )，14.20-14.21 
File encryption example (文件 加 密 示 例 )，566-569 
File IO (文件 IO) 
in the Irvine32 Librarg (在 Irvine32 链 接 库 中 )， 
468-470 
testing procedures of (测试 过 程 )，470-473 
FillArray procedure (FillArray 过 程 )，312，315 
FillConsoleOutputAttribute function (FillConsole- 
OutputAttribute 函数 )，450 
FillConsoleOutputCharacter function ( FillConsole- 
OutputCharacter 昂 数 )，450 
FindArray 
code generated by Visual C++ (Visual C++ 生成 代 
码 )，537 
Finite-state machine (FSM) (有 限 状态 机 )，219 
FINIT instruction (FINIT 指令 )，524 
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FISUB (subtract integer) instruction ( 减 整 数 指令 )， 
528-529 
Flags (标志) 
addition and subtraction( 加 法 和 减法 )，105-112 
attribute values and (属性 值 )，463 
setting and clearing CPU (设置 与 清除 CPU)， 
198-199 
Flat memory model (平坦 内 存 模式 ), 64, 557-558， 
564 
Floating-point binary representation ( 浮 点 数 二 进 制 
表示 )，511-518 
converting decimal fractions to binary reals (十 进 
制 小 数 转 换 为 二 进 制 实数 )，516-518 
creating IEEE representation (新 建 IEEE 表示 )， 
514-516 
IEEE binary floating-point representation ( IEEE 
二 进 制 浮 点 数 表示 )，512-513 
normalized binary floating-point numbers (规格 化 
二 进 制 浮 点 数 )，514 
single-precision exponents ( 单 精 度 阶 码 )，485- 
486 
Floating-point data type( 浮 点 数 类 型 )，524 
Floating-point decimal number ( 浮 点 十 进 制 数 )， 
$511 
Floating-point exceptions( 浮 点 异常 )，523 
Floating-point instructions set( 浮 点 指令 集 )，523- 
526 
Floating-point unit(FPU)( 浮 点 单元 )，39，40，48， 
518-539 
arithmetic instructions (算术 运算 指令 )，526-530 
code examples (代码 示 例 )，523-536 
comparing floating-point values (比较 浮 点 数 )， 
530-533 
exception synchronization (异常 同步 )，534-535 
floating-point exceptions( 浮 点 异常 )，523 
instruction set (指令 集 )，523-526 
masking and unmasking exceptions (屏蔽 与 非 屏 
项 异常 )，538-539 
mixed-mode arithmetic (混合 模式 运算 )，537- 
538 
reading and writing floating-point values ( 读 写 浮 
点 数 )，533-534 ; 
register stack (寄存 器 堆栈 )，519-52 
rounding (伟人 )，521-522 
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Flowcharts (流程 图 )，233 

FlushConsoleInputBuffer function ( FlushConsole- 
InputBuffer 函数 )，450 

FMUL instructions (FMUL 指令 )，526，529 

FMULP (multiply with pop) instructions ( 相 乘 并 出 
栈 指令 )，529 

FORC directive (FORC 人 擅 指 令 )，435-436 

FOR directive (FOR 伪 指 令 )，434-435 

FPU stack (FPU 堆栈 )，519-521 

FreeConsole function (FreeConsole 函数 )，450 

FST (store floating-point value) instruction (保存 浮 
点 数 指令 )，526 

FSTP (store floating-point value and pop) instructions 
(保存 浮 点 数 并 出 栈 指 令 )，526 

FSUB instruction (FSUB 指令 )，528-529 

FSUBP (subtract with pop) instruction ( 相 减 并 出 栈 
指令 )，528-529 

Function prototypes (函数 原型 )，574 

Function return values (函数 返回 值 )，575 


G 


General protection(GP) fault (一 般 保 护 错误 )，322 

General-purpose registers (通用 寄存 器 )，38-39 

GenerateConsoleCtrlEvent, 451 | 

GetCommandTail procedure ( GetCommandTail 过 
程 )，1$6，160，14.28 

GetConsoleCP function (GetConsoleCP 函数 )，451 

GetConsole CursorInfo function(GetConsole CursorInfo 
函数 )，451，476-477 

GetConsoleMode function ( GetConsoleMode 函数 )， 
451 

GetConsoleOutputCP function (GetConsoleOutputCP 
函数 )，451 

GetConsoleScreenBufferInfo function ( GetConsole- 
ScreenBuffermfo 隐 数 )，451，474 

GetConsoleTitle function ( GetConsoleTitle 渔 数 )， 
451 

GetConsoleWindow function ( GetConsoleWindow 
函数 )，451 

GetDateTime procedure ( GetDateTime 过 程 )，481- 
482 

Get file creation date and time (获取 文件 创建 日 期 
和 时 间 )，14.24 
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GetKeyState function (GetKeyState 函数 )，460 
GetLargestConsoleWindowSize function (GetLargest- 
ConsoleWindowSize 函数 )，451 
GetLastError API function (GetLastErrorAPI 函数 )， 
457 
GetLocalTime function ( GetLocalTime 函数 )，479- 
480 
GetMaxXY procedure (GetMaxXY 过 程 )，160 
GetMseconds procedure (GetMseconds 过 程 )，161， 
1755. .260 
GetNumberOfConsoleInputEvents function ( Get- 
NumberOfConsoleInputEvents 函数 )，451 
GetNumberOfConsoleMouseButtons function ( Get- 
NumberOfConsoleMouseButtons 函数 )，451 
GetProcessHeap (GetProcessHeap )，493-494 
GetStdHandle function ( GetStdHandle 函数 )，397， 
450-451 
GetTickCount function ( GetTickCount 函数 )，479- 
481 
Gigabyte (GB ( 吉 字 节 ))，13 
Global descriptor table (GDT) (全 局 描述 符 表 )， 
S02，504，506 
GNU assembler (GNU 汇编 器 )，2 
Gotoxy procedure (Gotoxy 过 程 )，161，349，15.19， 
16.23 
Granularity flag (粒度 标志 )，503 
Graphical Windows application (图 形 化 Windows 应 
用 程序 )，484-492 
ErrorHandler procedure ( ErrorHandler 过 程 )， 
488 
MessageBox function (MessageBox 函数 )，486 
program listing (程序 清单 )，488-492 
WinMain procedute (WinMain 过 程 )，486-487 
WinProc procedure (WinProc 过 程 )，487 


H 


Hardware，detecting overflow (硬件 ， 检 测 溢出 )， 
110 

HeapAlloc，493-494 

Heap allocation( 堆 分 配 )，492，494-495 

HeapCreate, 493-494 

HeapDestroy, 493-494 


HeapFree, 493, 495 
Heap-related functions( 堆 相关 函数 )，493 
HeapTest programs (HeapTest 程序 )，496-499 
Hello World program example ( Hello World 程序 实 
示例 )，14.11-14.12 
Hexadecimal addition (十 六 进 制 加 法 )，15-16 
Hexadecimal integers (十 六 进 制 整数 )，13-15 
converting unsigned hexadecimal to decimal (无 符 
号 十 六 进 制 数 转换 为 十 进 制 )，14-15 
converting unsigned decimal to hexadecimal (无 符 
号 十 进 制 数 转 换 为 十 六 进 制 )，15 
High-level console functions (高 级 控制 台 函 数 )， 
448 
High-level language (高 级 语言 )，4-7，9，47，214 
assembly language and (汇编 语言 )，6 
functions (函数 )，47 
High-level language interface (高 级 语言 接口 )， 
555-583 
general convention (通用 规范 )，556-557 
inline assembly code (内 幅 汇 编 代码 )，564-570 
linking to C/C++ in protected mode (保护 模式 下 
链接 到 C/C++)，570-583 
.MODEL directive(.MODEL 伪 指 令 )，557-559 


IA-32e mode (IA-32e 模式 ) 
compatibility mode (兼容 模式 )，43 
64-bit mode ( 64 位 模式 )，43 
IA-32 processor famliy (x86) ( IA-32 处 理 器 家 族 )， 
42-44 
IBM-PC and MS-DOS (IBM-PC 和 MS-DOS )， 
14.1-14.7 
coding for 16.bit programs (16 位 程序 编码 )， 
14.6-14.7 
INT instruction (INT 指令 )，14.5-14.6 
memory organization (存储 器 组 织 )，14.2-14.3 
redirecdng input-output ( 重 定向 输入 -输出 )， 
14.3-14.4 
software interrupts (软件 中 断 )，14.4 
IBM’S PC-DOS (IBM 的 PC-DOS), 14.1 
Identification number (processID) (标识 号 (进程 D))， 
了 


项 1 


Identifier (标识 符 )，58-59 
IDIV instruction (IDIV 指令 )，265-266 
IEEE floating-point binary formats ( IEEE 浮 点 二 进 
制 格式 )，512 
IEEE representation (IEEE 表示 )，514-516 
IEEE single-precision (SP) (IEEE 单 精 度 )，518 
.IF condition (. 正 条 件 )，225，226 
IF directive (IF 伪 指 令 )，227-228，423，432 
IFIDN directive (IFIDN 伪 指 令 )，424，433 
IFIDNI directive (IFIDNI 伪 指 令 )，424 
IF statements (IF 语句 ) 
creating (新 建 )，226-227 
loop containing (循环 包含 )，216 
nested in loop( 嵌 套 在 循环 中 )，214-215 
IMUI1 instruction (IMUL 指令 )，257-263 
bit string and (位 串 )，254 
examples (示例 )，259-260 
one-operand formats ( 单 操作 数 格式 )，257-258 
three-operand formats (三 操作 数 格式 )，258 
two-operand formats( 双 操作 数 格式 )，258 
unisgned multiplication (无 符号 乘法 )，259 
INC and DEC instruction (INC 和 DEC 指令 )，105 
INC instruction (INC 指令 )，61 
INCLUDE directive ( INCLUDE 伪 指 令 )，325， 
330，406 
Indexed operands ( 变 址 操作 数 )，119-121，395 
displacements，adding ( 偏 移 量 ， 加 法 )，120 
scale factors in 〈 比 例 因 子 )，120-121 
16-bit registers in ( 16 位 寄存 器 )，120 
IndexOf module (IndexOf 模块 )，570-573 
Indirect addressing (间接 寻 址 )，117-122 
arrays (数组 )，118-119 
indexed operands ( 变 址 操作 数 )，119-121 
indirect operands (间接 操作 数 )，117-118 
pointers (指针 )，121-122 
Indirect operands (间接 操作 数 )，117-118，120， 
297-298，346，395 
Infix expression( 中 缀 表达 式 )，519 
Inline assembly code (内 散 汇 编 代 码 )，S64-569 
_ asm directive in Microsonft Visual C++( Microsoft 
Visual C++ 中 的 asm 伪 指 令 )，564-566 
file encryption example (文件 加 密 示 例 )，566- 
569 
Inline expansion (内 联展 开 )，406 
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Input functions，MS-DOS (输入 函数 ，MS-DOS)， 
14.12-14.16 
Input-output parameter (输入 -输出 参数 )，320-321 
Input-output system (输入 一 输出 系统 )，47-49 
Input parameter (输入 参数 )，366 
Input string，validating (输入 字符 串 ， 验 证 )，219- 
220 
Instruction (指令 )，60-62 
comments (注释 )，62 
instruction mnemonic (指令 助 记 符 )，61 
label (标号 )，60 
operands (操作 数 )、61-62，546 
Instruction execution cycle (指令 执行 周期 )，34-36 
Instruction mnemonic (指令 助 记 符 )，61 
Instruction operand notation (指令 操作 数 符号 )，97 
Instruction pointer(EIP) (指令 指针 )，39 
Instruction set architecture (ISA) (指令 集 架 构 )，8 
INT (call to interrupt procedure) instruction (调用 
中 断 程序 指令 )，14.5-14.6 
common interrupts (常见 中 断 )，14.6 
interrupt vectoring (中 断 向 量 )，14.5 
INT 1Ah time of day (INT 1Ah 时 间 )，14.6 
INT 1Ch user timer interrupt ( INT 1Ch 用 户 定时 器 
中 断 )，14.6 
INT 10h video services (INT 10h 视频 服务 )，14.6 
INT 16h keyboard services ( INT 16h 键 盘 服 务 )， 
14.6 
INT 17h printer services (INT 17h 打印 机 服务 )，14.6 
INT 2lh function 0Ah (INT 21h 函数 0Ah)，14.13 
INT 2Ih function 0Bh (INT 21h 函数 0Bh)，14.14 
INT 21h function 1 (INT 21h 函数 1 )，14.12 
INT 21h function 2 (INT 21h 函数 2 )，14.9 
INT 2lh function 2Ah (INT 21h 函数 2Ah)，14.16- 
14.17 
INT 2lh function 2Bh (INT 21h 函数 2Bh)，14.16， 
14.17 
INT 2lh function 2Ch (INT 21h 阴 数 2Ch)，14.16， 
14.17 
INT 21h function 2Dh (INT 21h 函数 2Dh)，14.16， 
14.18 
INT 21h function 3Eh (INT 21h 项 数 3Eh)，14.23 
INT 21h function 3Fh (INT 21b 函数 3Fh)，14.15- 
14.16, 14.25 
INT 21h function 4Ch (INT 21h 函数 4Ch)，14.6， 
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14.8 
INT 21h function 5 (INT 21h 函数 5 )，14.9-14.10 
INT 21h function 6 (INT 21h 函数 6 )，14.9-14.10， 
14.12-14.14 
INT 21h function 9 (INT 21h 函数 9 )，14.9，14.10 
INT 21h function 40h (INT 21h 函数 40h)，14.9，14.11， 
14.26 
INT2lh function 42h (INT 21h 函数 42h)，14.23-14.24 
INT 2lh function 5706h (INT 21h 函数 5706h)，14.24 
INT21h function 716Ch (INT21h 函数 716Ch)，14.22 
INT 21h MS-DOS function calls ( INT 21h MS-DOS 
函数 调用 )，14.7-14.20 
INT 21h MS-DOS services (INT 21h MS-DOS 服 
务 )，14.6，14.34 
Integer arithmetic (整数 算术 运算 )，242-279 
ASCII and unpacked decimal arithmetic (ASCII 和 
非 压 缩 十 进 制 算术 运算 )，273-277 
extended addition and subtraction (扩展 加 法 和 减 
法 )，269-272 
multiplication and division instructions (乘除 指 
令 )，255-268 
packed decimal arithmetic (压缩 十 进 制 算术 运 
算 )，277-279 
shift and rotate applications ( 移 位 和 循环 移 位 应 
用 )，251-255 
shif and rotate instructions ( 移 位 和 循环 移 位 指 
令 )，243-251 
Integer arrays，searching and sorting (整数 数组 ， 检 
索 与 排序 )，373-382 
binary search (对 半 查 找 )，375-378 
bubble sort ( 冒 泡 排 序 )，372-375 
test program (测试 程序 )，378-382 
Integer arrays，summing (整数 数组 ， 求 和 )，126- 
121 
Integer constant ( 整 型 常量 )，55 
Integer expressions (整数 表达 式 )，56-57 
Integer literals (整数 常量 )，55-57 
Integers，adding and subtracting (整数 ， 加 法 和 减 
法 )，63-70 
Integer storage sizes (整数 存储 大 小 )，13 
Integer summation program (整数 求 和 程序 )，329， 
333 
Intel 64, 50 
execution environment (执行 环境 )，43-44 


operations mode (操作 模式 )，43 
Intel 486, 41, 158 
Intel 8086 processor (Intel 8086 处 理 器 )，518，539 
Intel 8088 processor (Intel 8088 处 理 器 )，14.1 
Intel 80286 processor (Intel 80286 处 理 器 )，610 
Intel microprocessors (Intel 微 处 理 器 )，14.2 
Intel P965 Express chipset ( Intel P965 Express 芯片 
组 )，45-47 
Intel Pentium, 33, 564 
Intel Pentium Core Duo, 33, 176, 572 
Intel processor families ( Intel 处 理 器 家 族 )，2，41， 
43 
Interrupt flags (中断 标志 )，40 
Interrupt handler (中 断 处 理 程序 )，14.4-14.5 
Interrupts (中 断 ) 
BIOS 16h functions (BIOS 16h 函数 )，D.9 
mouse functions (鼠标 函数 )，D.9 
PCs D2-D3 
10h functions( 10h 函数 )，D.8 
21h functions ( 21h 函数 )，D.4-D.7 
Interrupt service routines (ISRS) (中 断 服 务 例 程 )， 
14.6， 参 见 中 断 服务 程序 
Interrupt vectoring (中 断 向 量 )，14.5 
Interrupt vector table (中 断 向 量 表 )，14.2 
Intrinsic data types( 内 部 数据 类 型 )，74 
INVOKE directive (INVOKE 伪 指 令 )，72，89-90， 
311-312，599 
IO access，levels of (IO 访问 ， 层 次 )，47-49 
BIOS，47 
high-level language functions (高 级 语言 函数 )， 
47 
operating system (操作 系统 )，47 
Irvinel6.lib, 14.7 
Irvine32.lib, 153-154, 456 
Irvine32 Library (Irvine32 库 )，155 
overview (概述 )，157-158 
procedures in (过 程 )，156-157 
test programs〔 测 试 程序 )，170-177 
Irvine64 library (Irvine64 库 )，153，178-180，294 
string-handling procedures (字符 串 处 理 过 程 )， 
365-368 
IsDefined macro (IsDefined 宏 )，432 
IsDigit procedure ( IsDigit 过 程 )，162，221，223- 
224 


Java, 3-6, 8 
assembly language and (汇编 语言 )，4 
Virtual machine concept and (虚拟 机 概念 )，8 
Java bytecodes (Java 字 节 码 )，339-340 
instruction set (指令 集 )，340-341 
Java disassembly examples ( Java 反 汇编 示例 )， 
341-345 
Java virtual machine (JVM) ( Java 虚拟 机 )，339- 
340 
string processing and (字符 串 处 理 )，382-383 
Java Development Kit (JDK) ( Java 开发 工具 包 )， 
340 
Java disassembly examples ( Java 反 汇编 示例 )， 
341-345 
adding two doubles (两 个 double 类 型 数 相 加 )， 
343-344 
adding two integers (两 个 整数 相 加 )，341-343 
conditional branch (条 件 分 支 )，344-345 
Java HashSet，194 
Java primitive data types ( Java 基 本 数据 类 型 )， 
340-341 
Java virtual machine (JVM)(Java 虚拟 机 )，8，339- 
340 
Jcond (conditional jump) instruction (条 件 跳 转 指 
令 )，200-201 
conditional jump applications (条 件 跳 转 应 用 )， 
204-208 
equality comparisons (相等 比较 )，201-202 
signed comparisons (有 符号 数 比较 )，202-204 
unsigned comparisons (无 符号 数 比较 )，202 
JMP instruction (JMP 指令 )，123-124 


K 


Keyboard definition (键盘 定义 )，85 
Kilobyte (KB ( 千 字 节 ))，13 
Knuth, Donald, 2 


Label (标号 ),，60 
code (代码 )，60 
data (数据 )，60 
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directive( 伪 指令 )，116-117 
LAHF (load status flags into AH) instruction ( LAHF 
(状态 标志 加 载 到 AH) 指令 )，101 
LEA instruction (LEA 指令 )，298 
Least significant bit(LSB) (最低 有 效 位 )，10，245 
LEAVE-instruction (LEAVE 指令 )，298-300 
LENGTHOF operator ( LENGTHOF 运算 符 )，116， 
138 
Library procedures, MS-DOS (链接 库 过 程 )，MS- 
DOS, 14.24-14.25 
Library test program〔 链 接 库 测试 程序 )，170-171 
performance timing (性 能 计时 )，175-177 
random integers( 随 机 整数 )，174-175 
LIFO (Lasr-In, First-Out) structure (后 进 先 出 结构 )， 
144 
Linear addresses，translating logical addresses to ( 线 
性 地 址 ， 逻 辑 地 址 转换 )，500-503 
Linked list (链表 )，510 
Linker command options (链接 命令 选项 )，154 
Linkers (链接 器 )，3 
Linking 32-bit programs (链接 32 位 程序 )，154 
Link library，procedures in (链接 库 ， 过 程 )，154 
.LIST，598 
Listing file (列表 文件 )，71-73 
ListSize, 85-86 
Literal-text operator (<>) (文字 文本 运算 符 ( 二 ))， 
430-431 
Literal-character operator (!) (文字 字符 运算 符 (1! ))， 
431 
Little-endian order (小 端 顺序 )，91，252 
Load and execute process (加 载 和 执行 过 程 )，36- 
37 
Loader (加 载 器 )，71 
Load floating-point value (FLD) (加 载 浮 点 数 )， 
524-525 
Local descriptor table (LDT)( 局 部 描述 符 表 )，502 
LOCAL directive (LOCAL 人 擅 指 令 )，300-301， 
409-410 
Local variables (局 部 变量 )，295-296 


-LODSB instructions (LODSB 指令 )，353，356-357 


LODSD instruction (LODSD 指令 )，353 ，356-357 
LODSW instruction (LODSW 指令 )，356-357 
Logical AND operator (逻辑 AND 运算 符 )，213 
Logical OR operator (逻辑 OR 运算 符 )，214 


38 


Logical shifts versus arimmetic shifts (逻辑 移 位 与 
算术 移 位 )，243-244 

Loop instruction (循环 指令 )，123-128 

LOOPE (loop if equal) instruction( 相 等 则 循环 指令 )， 
209，624 

LOOPNE (loop if not equal) instruction (不 相等 则 循 
环 指令 )，209-210，624 

LOOPNZ (loop if not zero) instruction (不 为 零 则 循 
环 指 令 )，209-210，624 

LOOPZ (loop if zero) instruction ( 为 零 则 循环 指令 )， 
209，624 
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Machine language, relationship between assembly 
and( 机 器 语言 ， 与 汇编 语言 的 关系 )，4， 
8 
Macros ( 宏 ) 
additional features of (其 他 宏 特性 )，408-412 
code and data in (代码 和 数据 )，410-411 
comments in macros( 宏 注释 )，409 
debugging program that contains (调试 程序 包括 )， 
408 
declaring (声明 )，406 
defining (定义 )，406-407 
functions (函数 )，431-433 
invoking (调用)，407-408 
in library (链接 库 )，412-419 
nested ( 巾 套 )，411-412 
parameters( 形 参 )，407 
macro procedure( 宏 过 程 )，405-406 
Wrappers example program (封装 器 示例 程序 )， 
419-420 
Macros.inc library (Macros.inc 库 ) 
mDump, 414 
mDumpMem, 412-414 
mGotoxy, 414-415 
mReadString, 415-416 
mShow, 416-417 
mShowRegister,417 
mWriteSpace, 418 
mWriteString, 418-419 
makeString macro (makeString 宏 )，409-410 
Masking and unmasking exceptions (屏蔽 与 非 屏蔽 


异常 )，538-539 
MASM 
code generation (生成 代码 )，301 
Matrix row，summing (矩阵 行 ， 求 和 )，425-428 
mDump macro (mDump 宏 )，414 
mDumpMem macro (mDumpMem 宏 )，412-414 
Megabyte (MB ( 兆 字 节 ))，13 
Memory (内存)，46 
CMOS RAM, 46 
DRAM, 46 
dynamic allocation (动态 分 配 )，506 
EPROM, 46 
management (管理 )，499-505 
models (模式 )，557 
operands (操作 数 )，96-97 
physical (物理 )，501-502 
reading from ( 读 取 )，36 
ROM，46 
segmented model (分 段 模式 )，499 
storage unit (存储 单元 )，33 
SRAM，46 
virtual (虚拟 )，501-502 
VRAM，46 
Memory-mode instructions (内 存 模式 指令 )，544- 
547 
Merge procedure (Merge 过 程 )，301 
Message box display in Win32 application (在 Win32 
应 用 程序 中 显示 消息 框 )，452-455 
contents and behavior (内容 和 行为 )，452-453 
demonstration program (演示 程序 )，453-454 
program listing (程序 清单 )，454-455 
MessageBox function (MessageBox 函数 )，486 
mGotoxyConst macro ( mGotoxyConst 宏 )，423， 
429 
mGotoxy macro (mGotoxy 宏 )，414-415 
Microcode( 微 码 )，5 
Microcomputer (微型 计算 机 )，33-34 
Microsoft Macro Assembler (MASM) ( Microsoft 宏 
汇编 (MASM) )，2-3，54-55 
Microsoft X64 calling convention ( Microsoft x64 调 
用 规范 0，287，301-302 
Mixed-mode arithmetic (混合 模式 算术 运算 )，537- 
538 
MMX registers (MMX 寄存 器 )，41 
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Mnemonic ( 助 记 符 )，61 
.MODEL directive ( .MODEL 伪 指 令 )、64，558-559， 
575, 582 
C language specifier (C 语言 说 明 符 )，559 
language specifiers (语言 说 明 符 )，558 
STDCALL, 558-559 
Most significant bit(MSB) (最 高 有 效 位 )，10，107， 
245 
Motherboard (主板 )，44-46 
chipset (芯片 组 )，45-46 
MOY instruction (MOYV 指令 )，98-99，128-129 
opcodes (操作 码 )，544-546 
Move file pointer function (传送 文件 指针 函数 )， 
14.3-14.24 
MOVSB instruction (MOVSB 指令 )，353-355 
MOVSD instruction (MOVSD 指令 )，353-355 
MOVSW instruction (MOVSW 指令 )，353-355 
MOVSX (move with sign-extend) instruction (传送 
并 符号 扩展 指令 )，100-101，625 
MOVZX (move with zero-extend) instruction (传送 
并 全 零 扩展 指令 )，99-100，625 
mPutchar macro (mPutchar 宏 )，406 
mReadBuf macro (mReadBuf 宏 )，424 
mReadString macro (mReadString 宏 )，415-416 
MS-DOS 
device names (设备 名 称 )，14.4 
extended error codes (扩展 错误 码 )，14.21 
file date fields (文件 日 期 字段 )，254-255 
function calls (INT 21h) (函数 调用 )，14.7-14.20 
IBM-PC and，14.1-14.7 
memory map (内 存 映射 )，14.3 
MS-DOS file IO services (MS-DOS 文件 IO 服务 )， 
14.20-14.33 
close file handle (3Eh) (关闭 文件 句柄 )，14.23 
creating binary file (新 建 二 进 制 文件 )，14.30- 
14.33 
create or open file (716Ch) (新 建 或 打开 文件 )， 
14.22-14.23 
get file creation date and time (获取 文件 创建 日 期 
和 时 间 )，14.24 
move file pointer(42b) (传送 文件 指针 )，14.23- 
14.24 
read and copy a text file( 读 取 和 复制 文本 文件 )， 
14.25-14.27 
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reading MS-DOS command tail ( 读 取 MS-DOS 
命令 尾 )，14.27-14.30 
Selected library procedures (部 分 库 过 程 )，14.24- 
14.25 
MsgBoxAsk procedure ( MsgBoxAsk 过 程 )，156， 
162-163 
MsgBox procedure (MsgBox 过 程 )，156，162 
mShow macro (mShow 宏 )，416-417 
mShowRegister macro ( mShowRegister 宏 )，417， 
428 
MS-Windows virtual machine manager (MS-Windows 
虚拟 机 管理 器 )，504 
MUL (unsigned maltiply) instruction (MUL (无 符号 
乘法 ) 指令 )，253，255-257 
bit shifitng and ( 移 位 )，261-262 
examples (示例 )，256-257 
operands (操作 数 )，256 
Mul32 macro (Mul32 宏 )，430 
Multimodule programs (多 模块 程序 )，322 
ArraySum program (ArraySum 程序 )，326 
calling external procedures (调用 外 部 过 程 )，324- 
325 
creating modules using INVOKE and PROTO (用 
INVOKE 和 PROTO 新 建 模块 )，330-333 
creating modules using EXTERN directive ( 用 
EXTERN 伪 指 令 新 建 模块 )，326-330 
hiding and exporting procedure names (隐藏 和 输 
出 过 程 名 )，323-324 
module boundaries, variables and symbols in ( 模 
块 边界 ， 变 量 和 符号 )，325-326 
Mutiple shifts (多 次 移 位 ) 
in SHL instruction (用 SHL 指令 )，245 
in SHR instruction (用 SHR 指令 )，245 
Multiplexer (多 路 选择 器 )，26 
Multiplication and division instructions in integer 
arithmetic (整数 算术 运算 中 的 乘法 与 除法 
指令 )，255-268 
arithmetic expressions，implementing (算术 表达 
式 ， 实 现 )，267-268 
DIV instruction (DIV 指令 )，262-264 
IMUL instruction (IMUL 指令 )，257-260 
MUL instmction (MUL 指令 )，255-257 
signed integer division (有 符号 整数 除法 )，264- 
267 
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Multiplication table example (乘法 表示 例 )，576 
assembly language module (汇编 语言 模块 )，576- 
577 
C++ startup program (C++ 启动 程序 )，577-578 
Visual studio project properties ( visual studio 项 目 
属性 )，578-579 
Moultitasking (多 任务 )，499-500，502 
mWrite macro (mWrite 宏 )，411-412 
mWriteln macro (mWriteln 宏 )，411-412，422 
mWriteSpace macro (mWriteSpace 宏 )，412，418 
mWriteString macro (mWriteString 宏 )，406，412， 
418-419 


N 


Name decorations in C++ programs ( C++ 程序 的 名 
称 修饰 )，557，570 

Naming conventions (命名 规范 )，556-557 

NaNs (floating point) (NaNs ( 浮 点 数 ) )，516 

Negative infinity( 负 无 穷 )，516 

NEG instruction (NEG 指令 )，106，109-110 

Nested loops (循环 其 套 )，125 

Nested macros 〈 宏 艇 套 )，411-412 

Nested procedure call (过 程 调用 柑 套 )，148-149 

Netwide Assembler (NASM) (NetWide 汇编 器 )，2 

Non-doubleword local variables ( 非 双 字 局 部 变量 )， 
337-339 

NOP (No Operation) instruction ( NOP (无 操作 ) 指 
令 ), 62 

Normalized finite numbers (规格 化 有 限 数 )，515 

NOT (boolean operator) (NOT (布尔 运算 符 ))，22 

NOT instruction (NOT 指令 )，194，196 

Null-terminated string ( 空 字 节 结 束 的 字符 串 )，19， 
77，160，168-169，178，357，359，452， 
486，14.24-14.25，15.23-15.24 

Numeric data representation, terminology for (数字 


数据 表示 ， 术 语 )，20-21 
O 


， Object file (目标 文件 )，71 

OFFSET operator ( OFFSET 运 算 符 )，112-113， 
121, 129, 395, 399, 402, 565 

One's complement ( 反 码 )，196 


OpenInputFile procedure ( OpenInputFile 过 程 )， 
156, 158, 163 
Operands (操作 数 )，60-62 
direct memory (直接 内 存 )，96-97 
direct-offset (直接 - 偏 移 量 )，102-103 
floating-point instruction set ( 浮 点 指令 集 )，523- 
526 
instruction (指令 )，61-62，97 
types (类 型 )，61，90，9%6 
Operating system (OS) (操作 系统 )，32，36-38，42， 
44，47-49 
Operator precedence (运算 符 优先 级 )，24 
Opteron processor( 持 龙 处 理 器 )，33 ，43 
OPTION PROC:PRIVATE directive (OPTION PROC: 
PRIVATE 伪 指 令 )，323-324 
OR (boolean operator) (OR (布尔 运算 符 ) )，22-24 
OR instruction (OR 指令 )，192-193 
OS. See Operating system (OS)， 参 见 操作 系统 
Output functions，MS-DOS ( Output 函 数 )，MS- 
DOS), 14.9-14.11 
filtering control characters (过 滤 控 制 字 符 )，14.9- 
14.11 (过 滤 ) 
Output parameter (Output 形 参 )，319 
Overflow flag (溢出 标志 )，40，69，107，109-110， 
164，166，191，193，198，249，256， 
258-260，267 


P 


Packed binary coded decimal (BCD) (压缩 二 进 制 编 
码 的 十 进 制 数 (BCD))，80 
Packed decimal arithmetic (压缩 十 进 制 算术 运算 )， 
277-279 
DAA instructions (DAA 指令 )，277-278 
DAS instruction (DAS 指令 )，279 
Page fault (页 故障 )，501 
Paging (分 页 )，446，501 
Page translation (页 转换 )，500-501，503-504 
Parallel port (并 行 接口 )，45 
Parameter classifications (参数 类 别 ，319-320 
Parity flag (奇偶 标志 )，41，69，105-107，109， 
132，160，191-193，195-197，226，531 
ParseDecimal32 procedure ( ParseDecimal32 过 程 )， 
156，163 
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ParseInteger32 procedure (ParseInteger32 过 程 )，156， 
164 
Passing arrays (传递 数组 )，290 
Passing by reference (传递 引用 )，290 
Passing by value (传递 值 )，289 
Passing register arguments (传递 寄存 器 参数 )，150 
PCI (Peripheral Component Interconnecb bus (外 部 
设备 互联 总 线 )，45 
PC interrupts (PC 中 断 )，D.2-D.3 
PeekConsoleInput function (PeekConsoleInput 函数 ， 
451 
Pentium processor (奔腾 处 理 器 )，564，591 
Pixels (像素 )，48，484 
Pointers (指针 )，121-122 
POINT structure (POINT 结构 )，484-485，661 
POPAD instruction (POPAD 指令 )，143 
POPA instruction (POPA 指令 )，143 
POPFD instruction (POPFD 指令 )，142-143 
POP instruction (POP 指令 )，142 
Pop operation (出 栈 操作 )，141-142 
Positive infinity〈 正 无 穷 )，516 )，522 
Preemptive multitasking (抢先 多 任务 )，504 
printf function (printf 函数 )，579-581 
displaying formatted reals with (显示 格式 化 实数 )， 
S80 
PrintX macro (PrintX 宏 )，406 
PROC directive (PROC 人 擅 指 令 )，145-147，152， 
313-316，330-333 
parameter lists (参数 列表 )，313-316 
parameter passing protocol (参数 传递 协议 )，316 
RET instruction modified by (修改 的 RET 指令 )， 
316 
syntax of (语法 )，314 
Procedure call overhead (过 程 调用 开销 )，568-569 
Procedures (过 程 ) 
checking for missing arguments (检查 缺失 参数 )， 
421-422 
defining (定义 )，145 
calling external (调用 外 部 )，324-325 
labels in (标号 )，146 
linking to an external library (链接 到 外 部 库 )， 
153-154 
nested procedure calls ( 构 套 的 过 程 调用 )，148- 
149 


overhead of (开销 )，568-569 
Processor operand-size prefix (处 理 器 操作 数 大 小 
前 级)，543-544 
Process retum code (过 程 返 回 码 )，14.8 
Program execution times, measuring (程序 执行 次 
数 ， 计 算 )，260-262 
Programmable Interrupt Controller (PIC) (可 编程 中 
断 控制 器 )，45 
Programmable Interval Timer/Counter (可 编程 间隔 
定时 器 / 计数器)，45 
Programmable Parallel Port (可 编程 并 行 端 口 )，45 
Programming at multiple levels (多 层次 编程 )，48 
Program segment prefix (PSP) (程序 段 前 级 )，14.28 
PromptForIntegers procedure ( PromptForIntegers 过 
程 )，326-327，331 
Protected mode (保护 模式 )，3，38，40-42，64， 
14 335, 3985 432 493， S02% S57 
564, 584, 14.2, 15.15 
in indirect operands (间接 操作 数 )，117-118 
PROTO directive (PROTO 伪 指 令 )，154，179， 
316-319，323-324，330-333 ，574 
assembly time argument checking (汇编 时 参数 检 
查 )，317-319 
PTR operator ( PTR 运算 符 )，96，112，114-115， 
118 
PUSHA instruction (PUSHA 指令 )，143 
PUSHAD instruction (PUSHAD 指令 )，143 
PUSHFD instruction (PUSHFD 指令 )，142-143 
PUSH instruction (PUSH 指令 )，142 
PUSh operations (入 栈 操作 )，141 


Q 


Quadword (8 bytes) (四 字 (8 字 节 ))，132 

Quiet NaN (floating poinb (沉寂 NaN ( 浮 点 数 ))， 
516 

QWORD data type (QWORD 数据 类 型 )，74，79- 
80 


R 


Radix (基数 )，55-56，77 
Ralf Brown's Interrupt List ( Ralf Brown 中 断 列 表 )， 
14.8，D.1 
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Random32 procedure (Random32 过 程 )，156，164 

Randomize procedure (Randomize 过 程 ), 156, 164， 
178 

RandomRange procedure (RandomRange 过 程 )，156， 
164-165 

Range checking (范围 检查 )，102，229，423 

Raster scanning (光栅 扫描 )，48 

RCL (rotate carry left) instruction ( 带 进 位 循环 左 移 
指令 )，248-249 

RCR (rotate carry right) instruction ( 带 进位 循环 右 
移 指令 )，248-249 

ReadChar procedure (ReadChar 过 程 )，156 

ReadConsole function ( ReadConsole 枉 数 )，45， 
455-456 

ReadConsoleInput function ( ReadConsoleInput 耶 
数 )，451 

ReadConsoleOutput function ( ReadConsoleOutput 
函数 )，451 

ReadConsoleOutputAttribute function (ReadConsole- 
OutputAttribute 函数 )，451 

ReadConsoleOutputCharacter function(ReadConsole- 
OutputCharacter 函数 )，451 

ReadDec procedure (ReadDec 过 程 )，156 

ReadFile function (ReadFile 函数 )，466-467 

ReadFile program example ( ReadFile 程序 示例 )， 
471-473 

Read_File procedure (Read_File 过 程 )，315 

ReadFloat procedure (ReadFloat 过 程 )，533-534 

ReadFromFile procedure (ReadFromFile 过 程 ),156， 
16-166 

ReadHex procedure (ReadHex 过 程 )，156，166 

ReadInt procedure (Readint 过 程 )，157，166 

ReadKey procedure (ReadKey 过 程 ), 157, 166-167， 
205, 459-460 

Read-only memory(ROM) (只 读 存 储 器 )，46，14.2 

ReadSector example (ReadSector 示例 )，15.19 

ReadString procedure ( ReadString 过 程 )，157， 
167, 178, 415, 456, 14.24-14.25 

REAL4 data type (REAL4 数据 类 型 )，74，81 

REAL8 data type (REALS8 数据 类 型 )，74，81 

REAL10 data type (REAL10 数据 类 型 )，74，81 

Real-address mode programs (实地 址 模式 程序 )， 
38, 42, 124, 14.2, 14.6-14.8, 14.28, 
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14.34, 15.15-15.167 15:20。 15.26, 172; 
LR 
Real number data (实数 数据 )，81 
Rect (rectangle) structure (和 矩形 结构 )，485 
Recursion (递归 )，302-310 
factorial calculation (计算 阶乘 )，304-310 
recursively calculating a sum (递归 求 和 )，303- 
304 
Recursive procedure (递归 过 程 )，188 
Reduced instruction set computer (RISC) (精简 指令 
集 计算 机 )，346，539-540，564 
References to named structure (引用 命名 的 结构 )， 
394-395 
References to structure variables (引用 结构 变量 )， 
394-396 
Registet mode instructions (寄存 器 模式 指令 )，542- 
543 
Register parameters (寄存 器 参数 )，179，287-290 
Registets (寄存 器 )，38-41 
comparing (比较 )，228 
saving and restoring (保存 和 恢复 )，152-153， 
294-295 
Registet stack (寄存 器 堆栈 )，519-521 
64-bit ( 64 位 )，89-90 
Repeat blocks，defining (重复 块 ， 定 义 )，433-437 
REPEAT directive (REPEAT 人 擅 指 令 )，434 
.REPEAT directive ( .REPEAT 人 擅 指 令 )，225，231- 
232 
Repeat prefix (重复 前 缀 )，353-355 
Reserved words (保留 字 )，58 
RET (return from procedure) instruction (过 程 返 回 
指令 )，147-148，181-182，290，292-294， 
296, 303-304，314，316，321，331，363， 
58 372 
Reversing a string (字符 串 翻转 )，144-145 
REX (register extension) prefix (寄存 器 扩展 前 级 )， 
43-44 
ROL instruction (ROL 指令 )，247 
ROM. See Read-only memory (ROM) ( ROM， 参 见 
只 读 存 储 器 ) 
ROM BIOS, 14.3, 16.2, 17.24 
ROR instruction (ROR 指令 )，247-248 
Rounding in FPU (FPU 舍 人 入)，521-522 
Runtime relational and logical operators (运行 时 关 
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系 和 逻辑 运算 符 )，226-227 
Runtime stack (运行 时 堆栈 )，140-142 


S 


SAHF (store AH into status flags) instruction (AH 保 
存 到 状态 标志 指令 )，101 

SAL (shift arithmetic left) instruction (算术 左 移 指 
令 )，246 

SAR (shift arimmetic right) instruction (算术 右 移 指 
令 )，246 

SBB (subtract with borrow) instruction ( 带 借 位 减法 
指令 )，272 

SBYTE data type (SBYTE 数据 类 型 )，74-77 

Scale factors (比例 因子 )，120-121，371，426 

scanf function (scanf 郴 数 )，30，580-583 

SCASB instruction (SCASB 指令 )，353，356 

SCASD instruction (SCASD 指令 )，353，356 

SCASW instruction (SCASW 指令 )，353，356 

ScrollConsoleScreenBuffer funcdon ( ScrollConsole- 
ScreenBuffer 函数 )，451，473 

SDWORD data type (SDWRD 数据 类 型 )，74，79， 
314, 325, 392, 449 

Segment ( 段 )，40，55，59 

Segment descriptor details ( 段 描述 符 详 细 信 息 )， 
502-503 

Segment descriptor table ( 段 描述 符 表 )，40 

Segment limit( 段 限 长 )，502-503 

Segment names ( 段 名 )，556-557 

Segment present flag ( 段 存在 标志 )，503 

Segment registers ( 段 寄存 器 )，38，40 

Selected string procedures (部 分 字符 串 过 程 )，357- 


368 

Sequential search of array (顺序 搜索 数组 )，205- 
206 

Serial port ( 串 行 端口 )，49，14.4，16.36，17.14- 
17.15，17.24 


Set complement ( 补 集 )，194 
Set operations ( 集 操 作 ) 
intersection (交集 )，194 
union (并 集 )，194-195 
SetConsoleActiveScreenBuffer function (SetConsole- 
ActiveScreenBuffer 函数 )，451 
SetConsoleCP function (SetConsoleCP 函数 )，451 


SetConsoleCtrlHandler function ( SetConsole- 
CtrlHandler 函数 )，451 
SetConsoleCursorInfo function ( SetConsoleCursor- 
Info 函数 )，451，477 
SetConsoleCursorPosition function ( SetConsole- 
CursorPosition 隐 数 )，398-399，451，473， 
477 
SetConsoleMode function ( SetConsoleMode 函数 )， 
452 
SetConsoleOutputCP function ( SetConsoleOutputCP 
函数 )，452 
SetConsoleScreenBufferSize function ( SetConsole- 
ScreenBufferSize 函数 )，452，476 
SetConsoleTextAttribute function ( SetConsole- 
TextAttribute 函数 )，452，477 
SetConsoleTitle function (SetConsoleTitle 函数 ), 452， 
473 
SetConsoleWindowInfo function ( SetConsoleWin- 
dowInfo 函数 )，452，473-476 
SetCursorPosition procedure ( SetCursorPosition 过 
程 )，229-230 
SetFilePointer function ( SetFilePointer 孙 数 )，467- 
468 
SetLocalTime function ( SetLocalTime 函 数 )，479- 
480 
SetStdHandle function (SetStdHandle 函数 )，452 
SetTextColor procedure (SetTextColor 过 程 )，157 
Shift and rotate applications ( 移 位 和 循环 移 位 应 用 )， 
251-255 
binary multiplication (二 进 制 乘法 )，253 
displaying binary bits (显示 二 进 制 位 )，254 
isolating MS-DOS file data fields (提取 MS-DOS 
文件 数据 字段 )，254-255 
shifting multiple doublewords (多 个 双 字 的 移 位 )， 
252-253 
Shift and rotate instructions ( 移 位 和 循环 移 位 指令 )， 
243-251 
Shifting multiple donblewords (多 个 双 字 的 移 位 )， 
252-253 
SHL (shift left) instmuction ( 左 移 指令 )，243-245 
SHLD (shift left double) instructions ( 双 精 度 左 移 指 
令 )，243，249-251 
SHR (shift righb instruction ( 右 移 指令 )，243，245- 
246 
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SHRD (shift right double) instruction ( 双 精 度 右 移 
指令 )，243 ，249-251 
Signed and unsigned comparisons (有 符号 数 和 无 符 
号 数 比 较 )，227-228 
Signed division in SAI and SAR instruction (用 SAL 
和 SAR 指令 的 有 符号 除法 )，246 
Signed integer (有 符号 整数 )，16 
comparing (比较 )，228 
converting signed binary to decimal (有 符号 二 进 
制 数 转换 为 十 进 制 数 )，17 
converting signed decimal to binary (有 符号 十 进 
制 数 转换 为 二 进 制 数 )，17 
converting signed decimal to hexadecimal (有 符号 
十 进 制 数 转换 为 十 六 进 制 数 )，17 
converting signed hexadecimal to decimal (有 符号 
十 六 进 制 数 转换 为 十 进 制 数 )，17 
maximum and minimum values (最 大 值 和 最 小 值 )， 
18 
two's complement of hexadecimal value (十 六 进 
制 数 的 补 码 )，16 
two’s complement notation ( 补 码 符号 )，16 
validating (验证 )，212-216 
Signed integer division (有 符号 整数 除法 )，264-267 
divide overflow (除法 溢出 )，266-267 
IDIV instruction (IDIV 指令 )，265-266 
sign extension instructions (符号 扩展 指令 )，264-265 
Signed overflow (有 符号 溢出 )，110，249 
Sign flag (SF) (符号 标志 )，40，107，109，191， 
193, 198，201，206 
Significand (floating point) (有 效 数字 ( 浮 点 数 )) 
512-513 
precision (精度)，513 
SIMD (Single-Instruction，Multiple-Data) ( 单 指 令 
多 数据 )，41 
Single-byte instructions (单字 节 指 令 )，541 
Single-character input (单字 符 输入 )，459-460 
Single-line comments (单行 注释 )，62 
Single-precision bit encodings ( 单 精 度数 位 编码 )， 
S15 
Single-precision exponents ( 单 精度 阶 码 )，514 
16-bit argument ( 16 位 实 参 )，335-336 
16-bit parity ( 16 位 奇偶 )，196 
16-bit programs，coding for ( 16 位 程序 ， 编 码 )， 
14.6-14.7 
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16-bit real-address mode programs ( 16 位 实地 址 模 
式 程序 )，3 
64-bit operation modes ( 64 位 操作 模式 )，43 
Boolean instructions in (布尔 指令 )，199 
using IMUL (使 用 IMUL)，258-259 
using MUL (使 用 MUL)，257 
64-bit programming ( 64 位 编程 )，88-90，128-131 
assembly programming (汇编 编程 )，178-181 
SIZEOF operator (SIZEOF 运算 符 )，112，116 
SMALL_ RECT structure (SMALL RECT 结 构 )， 
461-462 
SmallWin.inc (include file)(SmallWin.inc( 头 文件 ))， 
397-398，405，447-4$0，453 ，466，581 
Software Development Kit (SDK) (软件 开发 工具 
包 )，154 
Software interrupts (软件 中 断 )，14.2，14.4 
Source operand ( 源 操作 数 )，61-62，98-99 
Special operators (特殊 运算 符 )，428-431 
Special-purpose registers (专用 寄存 器 )，521 
SRAM. See Static RAM (SRAM) Stackabstractdata- 
type (SRAM， 套 见 静态 RAM) 
Stack abstract data type (堆栈 抽象 数据 类 型 )，140- 
141 
Stack applications (堆栈 应 用 )，142 
Stack data structure (堆栈 数据 结构 )，140 
.STACK directive ( .STACK 伪 指 令 )，59，64，326， 
14.6，14.54 
Stack frames (堆栈 帧 )，287-302 
Stack parameters (堆栈 参数 )，287-290 
accessing (访问 )，290-292 
Stack operations (堆栈 操作 )，140-145 
affected by USES operator ( 受 USES 运算 符 影 
响 )，333-334 
defining and using procedures (定义 和 使 用 过 程 )， 
145-153 
passing stack arguments to procedures (向 过 程 传 
递 堆栈 实 参 )，335-337 
POP instruction (POP 指令 )，142 
PUSH instruction (PUSH 指令 )，142 
runtime stack (运行 时 堆栈 )，140-142 
Stack segment (堆栈 段 )，40，503，17.5 
Static RAM (SRAM) (静态 RAM)，36，46，50 
Status flags( 状 态 标志 )，40-41 
STC (set carry flag) instruction( 设 置 进位 标志 指令 )， 
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198，634 
STDCALL calling convention ( STDCALL 调 用 规 
范 )，293-294，408，590 
STDCALL language specifier (STDCALL 语言 说 明 
符 )，558-559，574 
STOSB instruction (STOSB 指令 )，353，356，635 
STOSD instruction (STOSD 指令 )，353，356，635 
STOSW instruction (STOSW 指令 )，353，356，635 
Str_compare procedure (Str_ compare 过 程 ), 157, 358- 
359,，366 
Str_copy procedure (Str_copy 过 程 )，157，357，359- 
360，366-367 
String (字符 串 )，19 
calculating the size of (计算 大 小 )，85-86 
copying a string (复制 字符 串 )，127-128，353- 
354 
defining (定义 )，77-78 
encryption (加 密 )，206-208 
reversing( 反 转 )，144-145 
String encryption program (字符 串 加 密 程序 )， 
14.14-14.16 
String library demo program (字符 串 库 演示 程序 )， 
364-365 
String primitive instructions (字符 串 原 语 指令 )， 
353-357 
StrLength procedure (StrLength 过 程 )，157 
Str_length procedure (Str_length 过 程 )，178，357， 
359，366-367 
Str_trim procedure ( Str trim 过 程 )，157，358，360- 
363 
Str_ucase procedure (Str_ucase 过 程 )，157，358，363 
Structure (结构 )，390-405 
aligning structure fields (对 齐 结构 字段 )，392 
allgning structure variables (对齐 结构 变量 )，394 
containing other structures (包含 其 他 结构 )，399 
declaring variables (声明 变量 )，393-394 
defining (定义 )，391-392 
indirect and index operands (间接 和 变 址 操作 数 )， 
395-396 
performance of aligned members (对 齐 成 员 的 性 
能 )，396 
references to members (引用 成 员 )，394-396 
referencing (引用 )，370-372 
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Structured Computer Organization (Tanenbaum)(《 结 
构 化 计算 机 组 织 》)，7 

SUB instructions (SUB 指令 )，67，106 
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SumOf procedure (SumOf 过 程 )，146-147，153 

SwapFlag，300，338 

Swap procedure ( Swap 过 程 )，290，312，315， 
320-321 

SWORD data type (SWORD 数据 类 型 )，74-75， 
78-79，11$，314，392 

Symbolic constant (符号 常量 )，84-88 

System management mode (SMM) (系统 管理 模式 )， 
38 

SYSTEMTIME structure (SYSTEMTIME 结构 ),397， 
440，479-480，482，505 

System time，displaying (系统 时 间 ， 显 示 )，397- 
399 
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Table-driven selection〈 表 驱动 选择 )，216-219 

TBYTE data type (TBYTE 数据 类 型 )，74，80， 
115-116, 314, 524, 593, 602 

Terabyte (TB ( 太 字 节 ))，13 

Terminal state (终止 状态 )，219-221 

Testing status bits (测试 状 态 位 )，204 

TEST instruction (TEST 指令 )，190，196-197 

Text editor (文本 编辑 器 )，64，71，16.14 
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14.20 
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373 
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368-369 
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exchanging (交换 )，320-321 
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TYPEDEF operator (TYPEDEF 运算 符 )，121-122， 
314 
TYPE operator (TYPE 运算 符 ),112, 115，120- 
121 
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Unconditional transfer (无 条 件 跳 转 )，123 

Unicode standard (Unicode 标准 )，19 

Uninitialized data, declaring( 未 初始 化 数据 ， 声 明 )， 
83 

Unsigned integers，ranges of (无 符号 整数 ， 取 值 范 
围 )，13 

.UNTIL condition (.UNTIL 条 件 )，225，231 

.UNTILCXZ condition (.UNTILCXZ 条 件 )，225 

Uppercase procedure (Uppercase 过 程 )，335-336 

USES operator (USES 运 算 符 )，152-153，317， 
333-335 
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Variables, adding (变量 ， 相 加 )，81-82 
Video memory area (视频 存储 区 )，14.3 
Video RAM (VRAM) (视频 RAM)，46，646-647 
Virtual-8086 mode (虚拟 8086 模式 )，38.40，42- 
43，504 
Virtual machine concept (虚拟 机 概念 )，7-9 
Virtual memory (虚拟 内 存 )，501-502 
Visual C++ command-line options ( Visual C++ 命令 
行 选项 )，559 
Visual Studio Debugger (Visual Studio 调试 器 ) 
arrays, displaying (数组 ， 显 示 )，125-126 
CPU flags in (CPU 标志 )，104 
Visual studio project properties ( Visual Studio 项 目 
属性 )，578-579 
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WaitMsg protedare ( WaitMsg 过 程 )，157，159， 


168，172 
Wait states (等 待 状态 )，34 
-WHILE condition (,WHILE 条 件 )，225，231-232 
WHILE directive (WHILE 伪 指 令 )，433-434 
WHILE loops (WHILE 循环 )，214-216，232 
White box testing ( 白 盒 测试 )，212-213 
Win32 API Reference Information ( Win32 API 参考 
信息 )，447 
Win32 console functions ( Win32 控制 台 函 数 ), 450- 
452 
Win32 console programming ( Win32 控制 台 编程 )， 
445-446 
background information (背景 信息 )，446-450 
console input (控制 台 输 入 )，455-461 
console output (控制 台 输 出 )，461-463 
console window mampulation (控制 台 窗口 操作 )， 
473-476 
controlling cursor (控制 光标 )，476-477 
controlling text color (控制 文本 颜色 )，477-478 
displaying message box (显示 消息 框 )，452-455 
file IO in Irvine32 library ( Irvine32 库 的 文件 1/ 
O), 468-470 
reading and writing files ( 读 写 文件 )，463-468 
testing file IO procedures (测试 文件 IO 过 程 )， 


470-473 
time and date functions (时 间 和 日 期 函数 )，479- 
482 
Win32 console functions ( Win32 控制 台 函 数 )， 
450-452 
Win32 date time functions ( Win32 日 期 时 间 函 数 )， 
479 


Win32 Platform SDK (Win32 平台 SDK)，446 
Windows API functions character sets and ( Windows 
API 函数 )( 字 符 集 )，447 
64-bit functions ( 64 位 函数 )，482-484 
Windows data types (Windows 数据 类 型 )，448 
WinMain procedure (WinMain 过 程 )，486-487 
WNDCLASS stmcture ( WNDCLASS 结 构 )，485- 
486，506 
WORD data type (WORD 数据 类 型 )，58，78 
Word (2 bytes) ( 字 (2 字 节 ))，13 
arrays of (数组 )，86，103 
WriteBinB procedure (WriteBinB 过 程 )，157，168 
WriteBin procedure ( WriteBin 过 程 )，157，168， 
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WriteChar procedure ( WriteChar 过 程 )，157，169， 
406-407 

WriteColors program (WriteColors 程序 )，478 

WriteConsole function ( WriteConsole 函 数 )，452， 
462 

WriteConsoleInput function ( WriteConsoleInput 天 
数 )，452 

WriteConsoleOutputAttribute function ( Write- 
ConsoleOutputAttribute 函数 )，452，477 

WriteConsoleOutputCharacter function ( Write- 
ConsoleOutputCharacter 函 数 )，452，461， 
463 

WriteConsoleOutput function ( WriteConsoleOutput 
函数 )，452 

WriteDec procedure (WriteDec 过 程 )，157，169 

WriteFile function (WriteFile 函数 )，467 

WriteFloat, 533-534 

WriteHex procedure (WriteHex 过 程 )，157，169， 
172 

WriteHexB procedure ( WriteHexB 过 程 )，157，169， 
179 

WriteHex64 procedure (WriteHex64 过 程 )，179， 
336-337 

WriteInt procedure ( WriteInt 过 程 )，155，157，169， 
172，443 

WriteStackFrame procedure ( WriteStackFrame 过 
程 )，157，322-323 

WriteString procedure ( WriteString 过 程 )，154，157， 
169, 172-173, 461, 14.25 

WriteToFile procedure ( WriteToFile 过 程 )，157， 
169-170 

WriteWindowsMsg procedure ( WriteWindowsMsg 
过 程 )，157，165-166，170，458，494-495 
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44 
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motherboard (主板 )，44-46 
x86 instruction coding ( x86 指令 编码 ) instruction 
format (指令 格式 )，540-541 
memory-mode instructions (内 存 模式 指令 )，544- 
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547 
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541-542 
processor operand-size prefix (处 理 器 操作 数 大 小 
前 缀 )，543-544 
register-mode instructions (寄存 器 模式 指令 )， 
542-543, 610 
single-byte instructions (单字 节 指 令 )，541 
x86 instruction format (x86 指令 格式 )，540-541 
x86 memory management ( x86 内 存 管理 )，41-42， 
446，499-504 
linear addresses (线性 地 址 )，500-503 
page transition (translation) (页 面 转换 )，503-504 
protected mode (保护 模式 )，42 
real-address mode (实地 址 模式 )，42 
x86 processor (x86 处 理 器 )，1， 4，16，29，62， 
82, 96, 155, 243, 261, 346,; 512， 


17.5, 610 
X86 processor architecture ( x86 处 理 器 架构 )，32- 
50 
execution environment (执行 环境 )，38-41，43- 
44 


floating-point unit ( 浮 点 单元 )，41 
modes of operation (操作 模式 )，37-38 
XCHG instruction (XCHG 指令 )，102 
XMM registers (XMM 寄存 器 )，41，43 
XOR instmctiion (XOR 指令 )，195-196，206，14.14 
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221, 223, 358, 386-387, 459,.531, 
14.12, 608 
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展 )，99 
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到 大 数 )，99 
MOVSX instruction (MOVSX 指令 )，100-101 
MOVZX instruction (MOVZX 指令 )，99-100 
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